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图 灵 社 区 的 电子 书 没有 采用 专 有 客 
户 端 ， 您 可 以 在 任意 设备 上 ， 用 自 
已 喜欢 的 浏览 器 和 PDF 阅读 器 进行 
阅读 。 

但 您 购买 的 电子 书 仅 供 您 个 人 使 
用 ， 未 经 授权 ， 不 得 进行 传播 。 
我 们 愿意 相信 读者 具有 这 样 的 良知 
和 完 悟 ， 与 我 们 共同 保护 知识 产 
权 。 

如 果 购 买 者 有 侵权 行为 ， 我 们 可 能 
对 该 用 户 实 施 包括 但 不 限于 关闭 该 
帐号 等 维权 措施 ， 并 可 能 追究 法 律 
责任 。 


集 智 俱乐部 (Swarm Agents 
Club， 简 称 “SA Club” ) ， 
成 立 于 2008 年 ， 是 一 个 从 事 学 
术 研 究 、 享 受 科 学 乐趣 的 探索 
者 组 成 的 团体 ， 倡 导 以 平等 开 
放 的 态度 、 科 学 实证 的 精神 进 
行 跨 学 科 的 研究 与 交流 ， 力 图 
搭建 一 个 中 国 的 “没有 围墙 的 
研究 所 ”。 


使 命 ( 目标 ) : 营造 自由 交流 
学 术 思 想 的 小 生境 ， 孕 育 开创 
性 的 科学 发 现 。 
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内 容 提 要 
本 书 由 集 智 俱乐部 成 员 共 同 创作 而 成 ， 全 面 介 绍 了 人 工 智 能 的 历史 及 其 在 各 个 领域 的 发 
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友 一 FOREWORD 1 


初 识 张江 ， 是 在 集 智 俱乐部 2011 年 4 月 的 一 次 科学 沙龙 上 。 那 一 次 ， 他 讲 的 题 
日 是 “有 寞 速生 长 律 "。 在 北京 北三 环 边 儿 上 一 个 叫 作 “ 验 号 会 所 ”的 咖啡 屋 里 ,不 大 
的 空间 ， 满 满 登 登 坐 了 四 五 十 号 人 , 一 个 下 午 ， 大 家 听 得 津津 有 味 。 为 什么 老 女 的 心 
脏 跳动 得 很 快 ， 而 大 象 、 乌 怨 的 很 慢 ? 动物 心脏 跳动 与 形体 生长 之 间 有 什么 关系 ? 进 
而 , 动物 的 体型 .个头 儿 与 它 的 新 陈 代谢 之 间 是 否 服从 什么 规律 ?张江 博士 九 妮 道 来 ， 
从 有 机 体 共同 莹 从 的 生长 规律 ， 谈 到 复杂 生命 系统 的 内 在 构造 ， 再 谈 到 城市 、 国 家 ， 
甚而 网 络 上 的 虚拟 组 织 所 共有 的 内 在 生长 机 制 。 后 来 听 阅 ， 那 一 天 的 听众 中 ， 还 有 专 
门 从 外 地 乘 飞 机 来 听讲 的 朋友 。 


集 智 俱乐部 的 网 站 最 初 是 张江 博士 在 2003 年 建立 的 。 通 过 张江 本 人 的 日 志 、 博 
客 ， 你 可 以 深 深 感受 到 一 位 执着 于 科学 理想 、 沉 浸 在 科学 典 堂 的 青年 学 者 的 欢 从 和 求 
索 。 他 的 文章 标签 和 日 志 目 录 展 示 了 他 的 足迹 ， 从 人 工 智能 、 系 统 科学 、 复 杂 科学 、 
量子 理论 、 互 联网 ， 到 科学 哲学 、 计 算 心理 学 、 生 态 学， 林林总总 。 这 些 标签 ， 既 是 
张江 自己 沉浸 其 中 的 见证 ， 也 是 吸引 和 凝聚 众多 青年 学 者 、 科 学 爱好 者 的 磁石 张 
江 的 伙伴 们 有 吴 令 飞 、 何 永 振 、 玉 德 俊 、 圳 行 远 、 王 东 等 ， 这 个 名 单 还 在 延长 。 

只 要 看 一 看 最 近 半年 俱乐部 活动 的 主题 ， 你 会 明白 这 是 一 群 怎样 的 人 : 高 级 认 知 
相关 的 另类 深度 学 习 ; 石头 -剪刀 - 布 中 的 统计 物理 ; 城市 的 数学 模型 一 他们 耐 着 性 
子 ， 仔 细 研 读 燃 起 内 心 激情 的 前 沿 课题 ， 他 们 平等 交流 ， 积 极 探索 。 他 们 的 口号 是 ; 
让 苹果 磺 得 更 猛烈 些 吧 ! 


2 ， 科 学 的 极致 : 漫谈 人 工 智能 


最 近 几 年 一 一 很 难说 具体 是 哪 一 年 ， 人 工 智能 忽然 再 次 大 热 。 也 许 是 美国 科 约 大 
片 如 《 阿 凡 达 光 源 代 码 光 和 盗 梦 空 间 光 星际 穿越 沁 超 能 陆 战 队 》 的 推波助澜 ， 也 许 
是 TED 演讲 上 大 量 涌现 的 四 旋 波 无 人 机 、 具 里 性 认 知 机 和 可 人 勾 起 人 们 无 限 遐 想 。 半 
个 多 世纪 以 来 ， 人工 智 能 经 历 了 几 次 大 的 起 伏 ， 这 一 次 大 热 ， 意 列 守 全 不 同 。 


大 约 20 年 前 ， 我 做 的 研究 生 论文 恰好 涉及 人 工 智能 。 当 年 使 用 Prolog 语言 做 命 
题 读 算 方面 的 研究 。 与 这 一 波 人 工 智 能 热 调 相 比 ， 我 以 为 基本 思想 已 发 生 重 大 变化 ， 
或 许可 以 概括 为 两 点 : 一 点 是 此 前 的 人 工 智 能 致力 于 “打造 超越 个 体 智 能 的 机 需 ”， 
而 这 一 波 人 工 智能 的 基本 思想 则 是 “ 具 号 性 ”， 即 探索 连接 、 交 互 、 复 杂 网 络 环境 下 
机 带 智 能 的 生长 、 人 与 机 带 的 融合 ， 以 及 人 机 生态 的 演进 ; 为 一 点 则 是 ， 此 前 的 人 工 
乔 能 致力 于 发 现 “ 撞 述 智 能 的 牛顿 定律 ", 今天 的 人 工 久 能 则 首先 怪 力 于 理解 “人 与 
机 带 、 机 各 与 环 蒂 的 交互 ， 究 竟 发 生 了 什么 ?”“， 重 新 理解 智能 机 青 与 人 、 机 表 与 机 
船 的 认 知 和 行为 之 间 错 绽 复 杂 的 关系 。 


在 我 看 来 ,“ 人 工 智 能 ”这 个 词语 多 少 珊 有 一 些 旧 的 、 机 械 决定 论 思 想 的 影 
用 来 描绘 互联 网 语 境 下 生机 动 动 的 新 “人 工 入 能 "， 用 来 描绘 充满 寞 质 性 、 多 样 性 、 
人 机 共生 的 新 世界 ， 多少 显得 力不从心 。 不 过 不 要 紧 , 词语 的 陈旧 不 能 阻挡 一 代 又 一 
代 探 索 者 重新 理解 、 认 识 和 解读 这 个 世界 的 脚步 。 


从 《科学 的 极致 : 漫谈 人 工 贸 能》 这 本 书 里 ,我 读 到 的 是 青年 等 者 们 满怀 激情 的 
畅想 、 孜 孜 不 们 的 求 守 和 他 们 对 新 世界 的 描绘 、 诠 释 和 展望 。 他 们 奉献 给 大 家 的 ,是 
科学 思想 的 激 沪 和 和 奔涌， 是 科学 信仰 的 诗意 和 想象 。 

这 是 一 群 令 人 时 做 的 、 充 满 激情 与 梦想 的 人 ， 这 是 一 幅 激 动人 心 的 画面 ， 这 是 令 
人 热血 沸腾 的 科 尝 之 旅 。 

感谢 作者 ， 能 让 我 匈 睹 为 快 。 齐 成 一 篇 ， 是 为 序 。 


段 永 彰 


财 讯 传媒 集团 (SEEC ) 首席 战略 官 ， 中 国 计 算 机 学 会 高 级 会 员 ， 数 字 论 坛 
创始 成 员 ， 中 国信 息 社 会 S0 人 论坛 成 员 ， 杭 州 师范 大 学 阿里 巴巴 商学 院 特 聘 教授 


友 ~ FOREWORD 2 


人 工 知 能 在 最 近 几 年 发 展 迅速 ， 已 成 为 科技 界 和 大 众 都 十 分 天 注 的 一 个 热点 领 
域 。 我 对 人 工 智能 的 研究 所 知 不 深 , 但 我 很 欣 沉 本 书 的 书 名 一 一 科学 的 极致 。 我 认为 ， 
人 工 镶 能 的 终极 科学 目标 是 实现 人 类 对 目 己 的 科学 理解 。 在 20 世纪 人 类 实现 了 对 守 
守 、 物 质 结构 的 深刻 认识 后 ,认识 生 命 以 及 人 类 目 己 一 定 会 成 为 新 的 核心 科学 领域 ， 
人 工 镶 能 成 为 科学 的 极致 应 该 是 科技 进步 的 必然 。 事 实 上 ， 曾 获得 图 灵 奖 和 话 册 尔 经 
济 学 奖 的 人 工 智能 的 开创 者 之 一 赫 伯 特 'A. 西 蒙 教授 , 在 他 的 代表 性 著作 《人 工科 学 》 
一 书 中 ， 就 建立 了 人 工科 学 的 概念 ， 从 大 脑 的 运作 机 制 、 心 智 的 适应 能 力 、 记 忆 和 学 
习 过 程 ， 一 直到 经 济 和 学 、 设 计 科学 、 管 理学 、 复 淋 性 研究 等 广泛 的 领域 ， 阐 述 了 人 工 
智能 所 期 望 达到 的 目标 以 及 建立 人 工科 学 的 可 能 性 和 基本 途径 。 

人 工 智 能 经 过 一 个 多 世纪 的 发 展 , 许多 当初 的 科学 约 想 变 成 了 现实 ， 而 同时 又 清 
现 出 许多 新 的 科学 问题 。 在 人 工 智 能 普 志 受到 关注 的 今天 ， 图 灵 公 司 出 版 这 样 一 本 关 
于 人 工 智 能 的 科普 车 作 可 以 说 是 恰 逢 其 时 。 本 书 由 集 智 俱乐部 的 成 员 们 集体 创作 , 笔 
和 触 虽 不 老 到 但 很 精致 耐 谈 。 我 了 解 集 冰 俱 乐 部 是 张江 博士 进入 北京 师范 大 学 系统 科学 
学 科 工 作 以 后 的 事情 , 其 后 我 就 一 二 关注 看 这 和 群 路 踏实 实 的 年 轻 人 在 科学 探索 上 的 不 
懈 努 力 。 他 们 一 方面 奶 求 在 科学 前 沿 上 的 创新 ,为 一 方面 通过 各 种 途径 普及 和 交流 各 
领域 的 科技 进展 和 科学 概念 ， 同 时 ， 还 努力 把 科学 进展 转变 为 技术 进步 以 造福 于 我 们 
的 社会 和 生活 。 在 这 样 一 个 喧嚣 和 功利 的 社会 里 ， 他 们 所 做 的 一 切 都 显得 十 分 难得 而 
有 意义 。 


相信 《科学 的 极致 : 提 谈 人 工 智能 》 能够 让 更 多 的 年 轻 人 了 解 和 豆 欢 上 人 工 智能 


2 ， 科 学 的 极致 : 漫谈 人 工 智能 


这 一 科技 前 认领 域 。 感 谢 图 灵 公 司 的 文 持 ， 也 期 待 春 集 智 俱乐部 能 够 创作 更 多 更 好 的 
科普 作品 。 
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集 智 俱乐部 是 一 个 发 源 于 互联 网 、 成 长 于 中 关 村 、 巾 一 大 群 趣味 相投 的 科学 青年 
与 技术 极 客 们 组 成 的 俱乐部 。 我 们 本 着 “营造 自由 交流 学 术 思 想 的 小 生境 ， 孕 育 开创 
性 的 科学 发 现 ”的 使 命 , 倡 导 以 平等 开放 的 态度 和 科学 实证 的 精神 进行 跨 学 科 的 研究 
与 交流 ， 力 图 搭建 一 个 中 国 的 “没有 围墙 的 研究 所 ”。 在 “让 苹果 砸 得 更 猛烈 些 吧 ” 
的 口号 召唤 下 ， 参 加 集 智 活 动 的 人 数 已 达 上 二 人 ,活跃 粉丝 将 近 30 人 。 经 过 7 年 多 
的 发 展 ， 集 智 核心 成 员 们 的 相互 合作 已 结 出 善 果 ,我 们 不 仅 在 主流 SCI 期刊 上 发 表 学 
术 论 文 , 出 版 自己 的 图 书 , 而 且 在 创业 大 淹 中 创建 自己 的 公司 , 开发 自己 的 产品 。“ 彩 
云天 气 ” 就 是 一 款 由 集 智 “统计 学 习 ” 读 书 会 衍生 出 的 产品 。 

自从 2007 年 成 立 以 来 ， 集 智 俱 乐 部 便 以 将 近 每 月 两 次 的 频率 ， 举 办 了 不 下 300 
次 讲座 、 读 书 会 、 沙 龙 等 大 大 小 小 的 活动 , 广泛 覆盖 了 生物 、 计 算 机 、 社 会 、 经 济 、 
互联 网 、 哲 学 与 宗教 等 多 个 学 科 和 主题 ， 像 “自由 意志 的 约 党 ”“21 世纪 的 生物 学 ” 
“从 《罗拉 快 跑 》 到 混沌 动力 学 ”“ 虚 拟 世 界 中 的 科学 研究 ”“ 数 学 与 音乐 的 命题 作文 ” 
合作 之 谜 : 一 个 来 自 人 工 社 会 的 启示 ” “算法 建筑 ”等 都 是 集 智 俱乐部 举办 的 经 典 、 
叫座 的 活动 。 

人 工 智 能 不 仅 是 科幻 电影 喜闻乐见 的 主题 ， 是 科学 极 客 们 的 最 终 梦 想 ， 是 技术 狂 
人 们 不 切实 际 、 异 想 天 开 的 代名词 ， 也 是 集 智 俱 乐 部 经 久 不 衰 的 讨论 话题 。 创 造 出 像 
我 们 人 类 一 样 思 考 的 机 器 是 所 有 俱乐部 成 员 的 梦想 。 

人 工 智能 是 一 个 非常 庞杂 的 学 科 ， 甚至 已 经 分 裂 为 很 多 子 学 科 。 所 以 ,在 构思 这 
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本 书 的 时 候 ， 我们 不 得 不 从 我 们 的 视角 来 进行 内 容 的 取舍 。 我 们 的 环 略 是 ， 关 注 人 工 
和 贸 能 最 古老 和 最 新 奇 的 主题 ， 舍 莽 挥 人 工 乔 能 发 展 长 河中 的 中 间 部 分 。 所 以 ， 与 一 般 
的 人 工 智 能 教科 书 和 科普 读物 不 同 ,在 这 里 你 会 看 到 有 关 图 灵机 、 哥 德尔 定理 等 本 人 
工 智能 诞生 有 春 密切 关系 的 “前 人 工 知 能 ”理论 ， 你 也 会 谈 到 深度 学 习 、 通 用 人 工 镶 
能 甚至 是 人 类 计算 等 近 几 年 才 发 展 出 来 的 新 思想 。 这 样 一 种 最 新 与 最 老 的 组 合 ， 路 越 
本 整个 人 工 智 能 的 历史 长 河 , 希望 能 够 给 读者 市 来 全 新 的 阅读 体验 ， 也 希望 能 够 让 读 
者 跳出 具体 的 搁 术 细 访 ， 从 而 深入 地 思考 人 工 留 能 的 本 质问 题 。 


下 面 对 本 书 的 内 容 进行 整体 介绍 ， 硕 望 读者 能 够 快速 找到 你 想 要 的 内 容 。 


第 1 章 是 对 整个 人 工 智能 学 科 发 展 历史 的 介绍 。 在 这 里 ,我 们 对 人 工 智 能 的 发 展 
做 了 大 致 的 阶段 划分 。 大 家 可 以 清晰 地 感受 到 整个 学 科 发 展 的 跌 知 起 伏 。 


第 2 章 到 第 4 草 则 介绍 了 人 工 智能 中 最 古老 的 部 分 ， 包 括 图 灵机 模型 《第 2 章 小 
冯 “ 庄 依 受 计 算 机 体系 结构 (第 3 草 ) 以 及 怪圈 与 架 德 尔 定理 【第 4 曹 )。 在 这 部 分 
内 容 中 ,我们 希望 读者 能 够 体会 到 早期 科学 家 们 的 开拓 精神 和 精 属 论断 ， 也 希望 读者 
看 到 ， 即 使 这 部 分 最 古老 的 人 工 智 能 思想 也 存在 看 很 多 尚 待 探索 的 问题 。 


第 5 草 到 第 12 草 则 介绍 了 人 工 千 能 领域 最 新 的 思想 和 成 有 末 。 首 先 ， 第 $ 章 着 重 
介绍 了 马 库 斯 ， 胡 特 (Marcus Hutter ) 的 通用 人 工 智能 理论 。 与 工业 界 奶 逐 不 断 细 化 
的 人 工 千 能 学 科 分 化 不 同 ， 胡 特 退 求 的 是 统一 的 兼 具 学 习 、 归 纳 、 推 理 功能 的 通用 人 
工 智能 算法 ， 从 而 站 在 前 人 的 基础 上 ， 用 一 个 数学 公式 定义 了 人 工 智能 。 


第 6 章 则 介绍 了 近年 来 被 业界 大 炒 特 炒 的 次 度 学 习 理 论 。 可 以 训 不 从 张 地 说 ， 这 
度 学 习 理 论 是 使 得 人 工 贸 能 再 次 复活 、 成 为 全 世界 关注 焦点 的 关键 推动 力 。 通 过 深度 
神经 网 络 学 习 大 数据 中 的 隐居 模式 ,工程 师 们 已 经 可 以 造 出 比拟 两 岁 小 孩 识别 能 力 的 


第 7 草 则 主要 探讨 人 工 智能 与 人 脑 在 信息 处 理 等 在 干 方面 的 异同 之 处 。 本 章 以 康 
便士 与 贝 博 士 对 话 的 方式 ， 将 这 些 理论 与 思考 娓 九 直 来。 


第 8 草 和 第 9 半 主 要 讨论 了 一 种 非常 为 类 的 人 工 入 能 一 一 人 类 计算 ， 即 通过 互联 
网 众 包 的 方式 , 让 人 类 目 己 帮助 计算 机 程序 来 实现 “人 工 知 能"。 尽 管 这 种 做 法 有 “ 作 
闵 ” 之 嫌 ， 但 是 它 却 代表 着 未 来 发 展 的 方 同 一 一 人 机 结合 。 而 在 人 机 关系 中 ， 起 到 核 
心 作用 的 因素 可 能 并 不 是 算法 ， 而 是 人 类 的 注意 力 。 因 为 注意 力 相 对 于 计算 机 中 的 虚 
拟 世 界 就 仿佛 是 太阳 辐射 的 能 量 相 对 于 地 球 上 的 生物 圈 。 从 这 样 的 视角 ,我 们 就 能 


到 注音 力 的 流动 与 日 然 界 中 河流 、 能 量 的 流动 所 具有 的 普遍 模式 ,这 就 是 第 9 章 讨 论 
的 主要 内 容 。 

第 10 革 则 转向 了 为 一 个 热门 的 人 工 贸 能 领域 一 一 日 然 语 言 处 理 。 无 论 是 文本 还 
是 语 首 ,与 我 们 老百姓 奶 明 相关 的 并 不 是 冷冰冰 的 工业 机 各 人 ， 而 是 能 够 聪明 理解 人 
类 语言 的 智能 程序 。 在 这 里 ,自然 语言 处 理 技术 将 成 为 核心 和 关键 。 


第 11 革 和 第 12 半 为 大 家 展现 了 一 种 为 类 的 理解 、 构 思 和 人工 管 能 的 视角 。 这 里 天 
注 的 不 再 是 个 体 机 希 人 ， 而 是 这 群 机 希 人 通过 相互 作用 而 涌现 出 来 的 集体 行为 。 人 类 
的 智力 不 也 是 来 目 于 成 千 上 万 个 神经 元 互动 的 请 现 模 式 吗 ?” 所 以 ,请 现 是 一 个 比 智能 
更 加 普 裔 、 也 更 加 重要 的 概念 (第 10 章 )。 通 过 巧妙 地 设计 机 各 人 的 相互 作用 规则 ， 
我 们 可 以 在 集体 层面 获得 智能 (第 11 章 )。 


第 13 草 和 第 14 草 则 介绍 了 两 名 集 智 俱乐部 成 员 实 践 人 工 智 能 的 应 用 案例 。“ 瓦 
克星 ”是 一 个 虚拟 的 星球 (第 13 章 ), 它 的 上 空 有 两 个 太阳 (一 个 双星 系统 )。 在 这 
样 的 另类 星球 中 会 衍生 怎样 的 星相 、 天 气 、 生 命 以 及 文化 ? 计算 机 模拟 撤 术 使 得 这 样 
的 奇 思 妙 想 成 为 可 能 。 彩云 天 气 则 是 一 球 可 以 精确 预测 未 来 一 小 时 内 会 不 会 下 雨 的 人 
工 智能 程序 (第 14 章 ) 借助 强大 的 深度 学 习 技术 ， 它 那 短 小 而 精准 的 预报 曾 使 得 彩 
云天 气 成 为 万 众 瞩 上 日 的 焦点 ， 也 使 得 集 智 读书 会 可 以 真正 地 开花 结果 。 


由 于 每 草 基 本 都 是 彼此 独立 的 , 所 以 大 家 可 以 根据 目 己 的 兴趣 选择 相关 的 草 节 阅 
谈 ， 不 必 按 照 前 后 顺序 展开 。 由 于 成 书 时 间 人 仓促， 书 中 难免 存在 一 些 芷 漏 之 处 ,和布 望 
读者 能 多 提 宝 叶 意 见 。 如 果 你 也 对 科学 充满 了 了 好奇 和 热情 ， 欢 迎 你 关注 集 吞 俱乐部 
( http://swarma.org )， 加 入 我 们 的 探索 活动 。 
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制造 出 能 够 像 人 类 一 样 思考 的 机 需 是 科学 家 们 最 伟大 的 梦想 之 一 。 用 智 蕊 的 大 脑 
解 谈 智 营 必 将 成 为 科学 发 展 的 终极 。 而 验证 这 种 解读 的 最 有 效 手 段 ， 真 过 于 再 造 一 个 
智 营 大脑 一 一 人 工 智能 (Artificial Intellijgence，AI )。 


人 们 对 人 工 知 能 的 了 解 似 人 主要 来 目 于 好 莱 凤 的 科 约 族 。 这 些 奕 幕 上 的 机 融 ( 见 
图 1-1 ) 要 人 么 杀人 如 麻 ， 如 《终结 者 》 黑 客 帝国 方 要 么 小 巧 可 爱 ， 如 《机 天 人 瓦 利 广 
有 要么 多 秘 善 感 ， 如 《人 工 智 能 方 还 有 一 些 则 大 音 和 希 声 、 大 象 无 形 ， 如 《墨客 帝国 》 


中 的 Matrix 网 络 , 以 及 《 超 验 骇 客 》《 超 体 》 所 有 这 些 灾 项 上 的 人 工 智能 都 具备 一 些 
共同 特征 : 异 闸 强大、 能力 非 几 。 


1-1 电影 中 的 人 工 智 能 
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然而 , 现实 中 的 人 工 智能 却 与 这 些 严 幕 上 的 机 絮 人 相差 其 远 , 但 它们 的 确 已 经 在 
我 们 吴 边 。 搜 索引 擎 、 邮 件 过 滤 需 、 智 能 语音 助手 Siri、 二 维 码 扫 摘 带 、 游 戏 中 的 NPC 
( 非 玩 家 扮演 角色 ) 都 是 近 60 年 来 人 工 智 能 技术 实用 化 的 产物 。 这 些 人 工 智 能 都 是 一 
个 个 单一 功能 的 “ 裸 ” 程序, 没有 坚硬 的 、 灵 活 的 躯壳 ,更 没有 想象 中 那么 善 解 人 意 ， 
甚至 不 是 一 个 完整 的 个 体 。 为 什么 想象 与 现实 存在 那么 大 的 差 踢 ?这 是 因为 ,真正 的 
人 工 乔 能 的 探索 之 路 充满 了 波折 与 不 确定 。 


历史 上 ， 研 究 人 工 智 能 就 像 是 在 坐 过 山 车 ， 忽 上 忽 下 。 梦 想 的 肥 蛙 泡 一 次 次 被 冰 
冷 的 科学 事实 截 破 , 科学 家 们 不 得 不 一 次 次 重新 回 到 梦 的 起 点 。 作 为 一 个 独立 的 学 科 ， 
人 工 智能 的 发 展 非 稼 奇 葛 。 它 不 像 其 他 学 科 那 样 从 分 散 走 同 统 一 ， 而 是 从 1956 年 创 
并 以 来 就 不 断 地 分 独 ， 形 成 了 一 系列 大 大 小 小 的 子 领域 。 也 许 人 工 乔 能 注定 就 是 大 杀 
烩 ， 也 许 统 一 的 时 刻 还 未 到 来 。 然 而 ， 人 们 对 人 工 智能 的 梦想 却 是 永远 不 会 磨灭 的 。 

本 章 将 按 历 史 的 顺序 介绍 人 工 镶 能 的 发 展 。 从 早期 的 哥 德 尔 、 图 灵 等 人 的 人 研究 到 
“人 工 智 能 ”一 词 的 提出 ， 再 到 后 期 的 人 工 智能 三 大 学 派 : 符号 学 派 、 连 接 学 派 和 行 
为 学 派 ， 以 及 近年 来 的 新 进展 : 贝 叶 斯 网 络 、 深 度 学 习 、 通 用 人 工 久 能 ; 最 后 我 们 将 
对 未 来 的 人 工 智 能 进行 展望 。 


梦 的 开始 (1900 一 1956) 


大 卫 : 希 尔 但 特 


说 来 可 怪 ， 人 工 贸 能 之 梦 开 始 于 一 小 气 20 世纪 初期 的 数 
学 家 。 这 些 人 真正 做 到 了 用 方程 推动 整个 世界 。 


历史 的 车 轮 倒 回 到 1900 年 ， 世 纪 之 交 的 数学 家 大 会 在 巴 
歼 如 期 召开 ， 人 德高望重 的 老 数 学 家 大 卫 : 希 尔 伯 特 ( David 
Hilbert ) 庄严 地 回 全 世界 数学 家 们 宣布 了 23 个 未 解决 的 难题 。 
这 23 道 难题 道道 经 典 ， 而 其 中 的 第 二 问题 和 第 十 问题 则 与 人 


a PEN /人 MN SN 、 SS David Hilbert 
工 智 能 密切 相关 ， 并 最 终 促 成 了 计算 机 的 发 明 。 (1862—1943) 


布尔 伯 特 的 第 二 问题 来 源 于 一 个 大 胆 的 想法 一 一 运用 公理 化 的 方法 统一 整个 数 
学 ,并 运用 严格 的 数学 推理 证 明 数 学 自身 的 正确 性 。 这 个 野心 被 后 人 称 为 硕 尔 伯 特 纲 
领 , 虽然 他 日 己 没 能 证 明 , 但 却 把 这 个 任务 交 给 了 后 来 的 年 轻 人 ， 这 就 是 布尔 但 特 第 


二 问题 : 证 明 数 学 系统 中 应 同时 具备 一 怪 性 ( 数学 真理 不 存在 矛盾 ) 和 完备 性 〈 任意 
在 理 都 可 以 被 描述 为 数学 定理 )。 


希 尔 但 特 的 动 动 野心 无 疑 激 励 看 每 一 位 年 轻 的 数学 家 ,其 
中 束 包 括 一 个 来 目 捷 元 的 年 轻 人 : 库 尔 特 ' 哥 德 尔 《Kurt 
Godel )。 他 起 初 是 硕 尔 们 特 的 忠实 粉丝 , 并 致力 于 攻 死 第 二 问 
种 。 然 而 ,他 很 快 发 现 ， 目 己 之 前 的 努力 都 是 徒 因 的， 因为 项 
尔 但 特 第 二 问题 的 断言 根本 就 是 错 的 : 任何 足够 强大 的 数学 公 
理 系统 都 存在 着 瑕 辛 : 一 致 性 和 完备 性 不 能 同时 具备 。 很 快 ， 
哥 德 尔 倒 艾 了 , 他 育 叛 了 和 硕 尔 们 特 , 但 却 推动 了 整个 数学 的 发 


展 ,， 于 1931 年 提出 了 被 美国 《时 代 周 刊 》 评 选 为 20 世纪 最 有 Kurt Godel 
影响 力 的 数学 定理 : 哥 德 尔 不 完备 性 定理 。 (1906 一 1978) 


尽管 早 在 1931 年 ， 人 工 智 能 学 科 还 没有 建立 ， 计 算 机 也 没有 发 明 ， 但 是 哥 德 尔 
定理 似乎 已 经 为 人 工 智 能 提出 了 和 警告。 这 是 因为 如 宋 我 们 把 人 工 闪 能 也 看 作 一 个 机 械 
化 运作 的 数学 公理 系统 ， 那 么 根据 哥 德 尔 定理 ， 必 然 存 在 着 茶 种 人 类 可 以 构造 、 但 是 
机 种 无 法 求解 的 人 工 智 能 的 “软肋 ”。 这 就 好 像 我 们 无 法 揪 春 目 己 的 脑 伦 脱 离 地 球 ， 
数学 无 法 证 明 数 学 本 吴 的 正确 性 ， 人 工 镶 能 也 无 法 仅 攒 日 吴 解决 所 有 问题 。 所 以 ,， 存 
在 者 人 类 可 以 求解 但 是 机 太 却 不 能 解 的 问题 ， 人 工 知 能 不 可 能 超过 人 类 。 

但 问题 并 没有 这 么 简单 ， 上 述 命题 成 立 的 一 个 前 提 是 人 与 机 融 不 同 ,不 是 一 个 机 
械 的 公理 化 系统 。 然 而 ， 这 个 前 提 是 否 成 立 迄 今 为 止 我 们 并 不 知道 ， 所 以 这 一 问题 仍 
在 争论 之 中 。 关 于 此 观点 的 延伸 讨论 请 参见 本 书 第 4 章 。 


义 伦 ' 图 灵 


另外 一 个 与 哥 德 尔 年 龄 相仿 的 年 轻 人 被 硕 尔 伯 特 的 第 十 
问题 深 深 地 吸引 了 ， 并 决定 为 此 奉献 一 生 。 这 个 人 就 是 艾 
伦 . 图 灵 (Alan Turing )。 

和 希 尔 们 特 第 十 问题 的 表述 是 :“ 是 否 存在 着 判定 任意 一 
个 丢 番 图 方程 有 解 的 机 械 化 运算 过 程 。 这 句 话 的 前 半 句 比较 a 和 
星 梁 ,我 们 可 以 先 忽 略 ， 因 为 后 半 人 句 是 重点 , “机械化 运算 过 (1912—1954) 
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程 ” 用 今天 的 话说 就 是 算法 。 然 而 ， 当 年 , 算法 这 个 概念 还 是 相当 模糊 的 。 于 是 ， 图 
灵 设 想 出 了 一 个 机 带 一 一 图 灵机 ， 它 是 计算 机 的 理论 原型 ， 圆 满 地 刻画 出 了 机 械 化 运 
算 过 程 的 含义 ， 并 最 终 为 计算 机 的 发 明 铺 平 了 道路 。 


图 灵机 模型 ( 见 图 1-2 ) 形象 地 模拟 了 人 类 进行 计算 的 过 程 。 假 如 我 们 希望 计算 
任意 两 个 3 位 数 的 加 法 : 139 + 919。 我 们 需要 一 张 足 够 大 的 草稿 纸 以 及 一 文 可 以 在 
纸 上 不 俘 地 涂 涂 写 写 的 笔 。 之 后 , 我 们 需要 从 个 位 到 特 位 一 位 一 位 地 按照 10 以 内 的 
加 法 规则 完成 加 法 。 我 们 还 需要 考虑 进位 , 例如 9+9=18, 这 个 工 就 要 加 在 十 位 上 。 
我 们 是 通过 在 草稿 纸 上 记 下 适当 的 标记 来 完成 这 种 进位 记忆 的 。 最 后 ， 我 们 把 计算 
的 结果 输出 到 了 纸 上 。 


1-2 图 灵机 模型 


图 灵机 把 所 有 这 些 过 程 都 模型 化 了 : 草 称 纸 被 模型 化 为 一 条 无 限 长 的 纸 带 ， 笔 被 
模型 化 为 一 个 读 写 头 ， 固 定 的 10 以 内 的 运算 法 则 模型 化 为 输入 给 谈 写 头 的 程序 ， 对 
于 进位 的 记忆 则 和 被 模型 化 为 谈 与 头 的 内 部 状态 。 于 是 ， 设 定好 纸 市 上 的 初始 信息 ， 以 
及 谈 写 头 的 当前 内 部 状态 和 程序 规则 ,图 灵机 就 可 以 运行 起 来 了 。 它 在 每 一 时 刻 该 人 
一 格 纸 市 的 信息 ， 并 根据 当前 的 内 部 状态 ， 查 找 相 应 的 程序 ， 从 而 给 出 下 一 时 刻 的 内 
部 状态 并 输出 信息 到 纸 带 上 。 关 于 图 录 机 的 详细 描述 ， 请 参见 本 书 第 2 章 。 


图 灵机 模型 一 经 提出 束 得 到 了 科学 家 们 的 认可 ,这 无 疑 给 了 图 灵 名 大 的 玛 励 。 他 
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开始 玛 起 勇气 ， 展 开 想象 的 翅膀 ,进一步 思考 图 灵机 运算 能 力 的 极限 。1940 年 ,图 灵 
开始 认真 地 思考 机 各 是 否 能 够 具备 类 人 的 乔 能 。 他 马上 意识 到 这 个 问题 的 要 点 其 实 并 
不 在 于 如 何 打造 强大 的 机 答 ， 而 在 于 我 们 人 类 如 何 看 行 智能 ， 即 依据 什么 标准 评价 一 
侣 机 器 是 否 具备 智能 。 于 是 ， 图 灵 在 1950 年 发 表 了 《机 器 能 思考 吗 ?》 一 文 ， 提 出 
了 这 样 一 个 标准 : 如 末 一 台 机 带 通 过 了 “图 灵 测 试 "， 则 我 们 必须 接受 这 从 机 带 上 共有 
贸 能 。 那 么 ， 图 灵 测 试 究 范 是 走样 一 种 测试 呢 ? 


如 图 1-3 所 示 ， 假设 有 两 间 密 闭 的 屋子 ， 其 中 一 间 屋 子 里 面 天 了 一 个 人 ， 男 一 间 
屋子 里 面 关 了 一 台 计 算 机 : 进行 图 灵 测 试 的 人 工 智 能 程序 。 然 后 ,屋子 外 面 有 一 个 人 
作为 测试 者 , 测试 者 只 能 通过 一 根 导线 与 屋子 里 面 的 人 或 计算 机 交流 一 一 与 它们 进行 
联网 聊天 。 假 如 测试 者 在 有 限 的 时 间 内 无 法 判断 出 这 两 间 屋 子 里 面 哪 一 个 天 的 是 人 ， 
哪 一 个 是 计算 机 ， 那么 我 们 就 称 屋子 里 面 的 人 工 智 能 程序 通过 了 图 灵 测 试 , 并 具备 
智能 。 事实 上 , 图 灵 当 年 在 《机 各 能 思考 吗 ?》 一 文中 设立 的 标准 相当 宽 沁 : 只 要 有 30% 
的 人 类 测试 者 在 5 分 钟 内 无 法 分 辨 出 被 测试 对 象 ， 束 可 以 认为 程序 通过 了 图 灵 测 试 。 


es [| 


I 
a 


1-3 ”图 灵 测 试 示意 


2014 年 6 月 12 日 ,一 个 名 为 “ 尤 金 ”( Eugene Goostman ) 的 聊天 程序 ( 见 图 1-4 ) 
成 功 地 在 5 分 钟 内 演 骗 了 30% 的 人 类 测试 者 ， 从 而 达到 了 图 灵 当 年 提出 来 的 标准 。 很 多 
人 认为 , 这 于 程序 具 有 划时代 的 意义 , 它 是 自 图 灵 测 试 提 出 64 年 后 第 一 个 通过 网 灵 测 试 
的 程序 。 但 是 ， 很 快 束 有 人 提出 这 只 不 过 是 一 个 嗓 头 ， 该 程序 并 没有 宣传 的 那么 历 害 。 
例如 ， 谷 歌 公 司 的 工程 总 监 、 未 来 学 家 雷 ' 库 效 韦 尔 (RayKurzweil ) 就 表示 ， 这 个 聊天 
机 兢 人 号 称 只 有 13 岁 ， 并 使 用 第 二 语言 来 回答 问题 ， 这 成 为 了 该 程序 重大 缺陷 的 借口 。 


6 ， 科 学 的 极致 : 漫谈 人 工 智能 


为 外 , 测试 者 只 有 $ 分 钟 与 之 展开 互动 , 这 大 大 增加 了 他 们 在 短期 内 被 “欺骗” 的 概率 。 


Eugene Goostma 
THE 


ne n 
WEIRDEST CREATURE IN THE WORLD 


| am fine, thanks, and you? 


Type your question here: -一 一 _ 
lm good. You doing anything fun today? 
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由 此 可 见 ， 图 灵 将 智能 等 同 于 符号 运算 的 智能 表现 ， 而 忽略 了 实现 这 种 符号 智能 
表现 的 机 答 内 独 。 这 样 做 的 好 处 是 可 以 将 所 谓 的 智能 本 质 这 一 问题 纸 过 去 ， 它 的 代价 
是 人 工 乔 能 人 研制 者 们 会 把 注意 力 集中 在 如 何 让 程序 欺骗 人 类 测试 者 上 , 甚至 可 以 不 择 
手段 。 所 以 ， 对 于 将 图 灵 测 试 作为 评判 机 带 具 备 智 能 的 唯一 标准 ， 很 多 人 开始 质疑 。 
为 人 类 智能 还 包括 诸如 对 复杂 形式 的 判断 、 创 造 性 地 解决 问题 的 方法 等 ， 而 这 些 特 
质 都 无 法 在 图 灵 测 试 中 体现 出 来 。 


总 而 言 之 ,图 灵 的 人 研究 无 颖 大 大 推动 了 人 工 智能 的 进展 。 然 而 ,图 灵 本 人 却 于 1954 
年 死 于 一 个 被 剧 毒 扎 化 物 注 射 过 的 乎 末 ， 邓 年 仅仅 42 岁 。 传 逆 他 是 一 名 同性 恋 ， 这 
在 当时 的 类 国 是 非法 的 。 于 是 英国 政府 强行 给 他 注射 一 种 药物 抑制 他 的 同性 恋 倾 问 ， 
这 导致 他 最 终 在 治疗 期 间 痛 震 万 分 地 目 杀 了 。 据 说 ， 平 末 公 司 为 了 纪念 这 位 计算 机 科 
学 之 父 , 特意 用 那个 被 图 灵 哎 挥 一 口 的 平 来 作为 公司 的 logo。1966 年 , 关 国 计算 机 协 
会 设立 了 以 网 灵 命 名 的 图 灵 奖 ， 以 专门 奖励 那些 对 计算 机 事业 作出 重要 贡献 的 人 ， 这 
相当 于 计算 机 领域 的 语 贝 尔 奖 。 


约 输 : 双 : 话 依 曼 


就 在 哥 德 尔 绞 尽 脑汁 捉摸 希 尔 伯 特 第 二 问题 的 时 候 , 另外 
一 个 来 自 匈 牙 利 布达佩斯 的 天 才 少 年 也 在 思考 同样 的 问题 , 他 
就 是 大 名 电 电 的 约 萌 :汉语 依 曼 (John von Neumann )。 


然而 , 冯 ，… 诸 依 曼 远 没有 哥 德 尔 走运 。 到 了 1931 年, 冯 详 


依 曙 即将 在 希 尔 伯 特 第 二 问题 上 获得 突破 , 却 突然 得 知 哥 德尔 (1903 一 1957) 


已 经 发 表 了 哥 德 尔 定理 ， 先 他 一 步 。 于 是 ， 冯 “ 庆 依 曼 一 气 之 下 开始 转行 研究 起 了 量 
子 力学 。 就 在 他 的 量子 力学 研究 即将 结 出 硕果 之 际 ， 另 外 一 位 天 才 物 理学 家 保罗 “' 狄 
拉克 ( Paul Dirac ) 又 一 次 抢 了 他 的 风头 ， 出 版 了 《量子 力 等 原理 》， 并 一 举 成 名 。 这 比 
冯 ，。 库 依 受 的 《量子 力学 的 数学 基础 》 整 整 呈 了 两 年 。 


受到 两 次 打击 之 后 , 冯 ' 话 依 曼 开始 把 部 分 注意 力 从 基础 数学 转向 了 工程 应 用 领 
域 , 终于 大 获 成 功 。1945 年 ,凭借 出 众 的 才华 , 冯 : 诺 依 曼 在 火车 上 完成 了 早期 的 计 
算 机 EDVAC 的 设计 ， 并 提出 了 我 们 现在 熟知 的 “ 汉 : 诺 依 曼 体 系 结构 ”。 


冯 ，… 诺 依 曼 的 计算 机 与 图 灵机 是 一 脉 相 承 的 , 但 最 大 的 不 同 就 在 于 ,， 冯 : 庄 依 蝇 
的 读 写 涉 不 再 需要 一 格 一 格 地 读 写 纸币 ,而 是 根据 指定 的 地 址 , 随机 地 跳 到 相应 的 位 置 
完成 谈 与 。 这 也 就 是 我 们 今天 所 说 的 随机 访问 存储 兹 ( Random Access Memory，RAM ) 
的 前 身 。 关 于 冯 “' 诡 依 曼 体 系 结 构 和 现代 计算 机 的 工作 原理 ， 请 参见 本 书 第 3 章 。 


汉族 依 竖 的 计算 机 终于 使 得 数学 家 们 的 研究 结 出 了 硕 东 ,也 最 终 推 动 春 人 类 历 
史 进 入 了 信息 时 代 ， 使 得 人 工 智能 之 梦 成 为 了 可 能 。 


诺 伯 特 ' 维 纳 


我 们 要 介绍 的 最 后 一 位 数学 家 是 美国 的 天 才 神 童 诡 介 

寺 ， 维 纳 ( Norbert Wiener )。 据说 维 纳 三 岁 的 时 候 就 开始 在 父 杀 

的 影响 下 该 天 文学 和 生物 学 的 网 书 。 七 岁 的 时 候 他 所 读 的 物理 
学 和 生物 学 的 知识 范围 已 经 超出 了 他 父亲 。 他 年 纪 轻 轻 就 掌握 
了 拉丁 霹 、 硕 有 舌 语 、 德 志和 英语 ， 并 且 涉 猎人 类 科学 的 各 个 领 
域 。 后 来 ， 他 留学 欧洲 ， 曾 先后 拜师 于 罗素 、 和 而 尔 们 特 、 哈 代 
等 哲学 、 数 学 大 师 。 维 纳 在 他 70 年 的 科学 生涯 中 ， 先 后 涉足 
数学 、 物 理学 、 工 程 学 和 生物 学 ， 共 发 表 240 多 访 论 文 ， 车 作 


Norbert Wiener 
14 本 。 (1894—1964) 


然而 ， 与 我 们 的 主题 最 相关 的 ， 则 要 数 维 纳 于 1948 年 提出 来 的 新 兴学 科 “ 控 制 
论 ”( Cybernetics ) 了 。“Cybernetics” 一 词 源 于 希腊 语 的 “掌舵 人 ”。 在 控制 论 中 ， 维 
纳 深 入 探讨 了 机 带 与 人 的 统一 性 一 一 人 或 机 各 都 是 通过 反馈 完成 某 种 目的 的 实现 ， 
此 他 揭示 了 用 机 怖 模拟 人 的 可 能 性 ,这 为 人 工 智能 的 提出 更 定 了 重要 基础 。 维 纳 也 是 
最 早 注意 到 心理 学 、 脑 科学 和 工程 学 应 相互 交叉 的 人 之 一 ,这 促使 了 后 来 认 知 科学 的 
及 展 。 
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这 几 位 数学 大 师 不 满足 于 “ 恩 进 小 楼 成 一 统 ”， 埋 头 解决 一 两 个 超级 数学 难题 。 
他 们 的 思想 大 胆 地 拥抱 了 斑驳 复杂 的 世界 ， 最 终 用 他 们 的 方程 推动 了 社会 的 进步 ， 开 
局 了 人 工 入 能 之 梦 。 


梦 的 延续 (1956 一 1980) 


在 数学 大 师 们 铺 平 了 理论 让 路 ,工程师 们 路 平 了 技术 坎坷 ， 计 算 机 已 吸 吸 落地 的 
时 候 ， 人 工 智能 终于 横 空 出 世 了 。 而 这 一 历史 时 刻 的 到 来 部 是 从 一 个 不 起 眼 的 会 议 开 
始 的 。 


达 特 多 斯 会 议 

1956 年 8 月 ,在 美国 汉 详 斯 小 镇 宁静 的 达 特 闻 期 学 院 中 ， 约 其 ， 关卡 更 〈 John 
McCarthy )、 蕊 文 : 闵 斯 其 ( Marvin Minsky， 人 工 智能 与 认 知 学 专家 )、 克 萎 德 .香农 
( Claude Shannon， 信 息 论 的 创始 人 )、 艾 伦 ' 纽 厄 尔 ( Allen Newell， 计算机 科学 家 小 
赫 伯 特 . 西蒙 (Herbert Simon， 诺 贝尔 经 济 学 奖 得 主 ) 等 科学 家 正 聚 在 一 起 ， 讨 论 着 
一 个 完全 不 食 人 间 烟 火 的 主题 ， 用 机 可 来 模仿 人 类 学 习 以 及 其 他 方面 的 智能 。 


会 以 足 足 开 了 两 个 月 的 时 间 , 虽然 大 家 没有 达成 普 志 的 共识 , 但 是 却 为 会 议 讨 论 
的 内 容 起 了 一 个 名 字 : 人 工 稼 能 。 因 此 ，1956 年 也 就 成 为 了 人 工 智 能 元 年 。 


黄金 时 期 


达 特 郑 斯 会 以 之 后 ， 人 工 智能 获得 了 井喷 式 的 发 展 ， 好 消息 接 星 而 至 。 机 希 定 理 
证 明 一 一 用 计算 机 程序 代替 人 类 进行 自动 推理 来 证 明 数 学 定理 一 一 是 最 移 取 得 重大 
突破 的 领域 之 一 。 在 达 特 茅 斯 会 议 上 ， 纽 反 尔 和 西蒙 展示 了 他 们 的 程序 :“ 逻 辑 理 论 
家 ”可 以 独立 证 明 出 《数学 原理 》 第 二 章 的 38 条 定理 ; 而 到 了 1963 年 ， 该 程序 已 能 
证 明 该 章 的 全 部 52 条 定理 。1958 年 ， 美 籍 华人 王 浩 在 IBM704 计算 机 上 以 3~5 分 钟 
的 时 间 证 明了 《数学 原理 》 中 有 关 命 题 演 算 部 分 的 全 部 220 条 定理 。 而 就 在 这 一 年 ， 
IBM 公司 还 人 研制 出 了 平面 几何 的 定理 证 明 程序 。 

1976 年 , 凯 尼 斯 . 阿 佩 尔 ( Kenneth Appel ) 和 沃 夫 风 : 哈 肯 (Wolfgang Haken ) 
等 人 利用 人 工 和 计算 机 混合 的 方式 证 明了 一 个 著名 的 数学 猜想 : 四 色 猜 想 (现在 称 
为 四 色 定 理 )。 这 个 猜想 表述 起 来 非 背 简单 易 收 : 对 于 任意 的 地 图 , 我 们 最 少 仅 用 四 


种 颜色 就 可 以 染色 该 地 图 ， 并 使 得 任意 两 个 相 邻 的 国家 不 会 重 色 ; 然而 证 明 起 来 却 
异 第 烦 天 。 配 合 着 计算 机 超 强 的 穷 举 和 计算 能 力 ， 阿 佩 尔 等 人 把 这 个 猜想 证 明了 。 


为 一 方面 ， 机 带 学 习 领 域 也 获得 了 实质 的 突破 ， 在 1956 年 的 达 特 芒 斯 会 议 上 ， 
阿 瑟 . 院 绪 尔 ( Arthur Samuel ) 人 赋 制 了 一 个 跳 覃 程序 ， 该 程序 具有 目 学 习 功 能 ， 可 以 
从 比赛 中 不 断 总 结 经 验 提高 棋艺 。1959 年 ,该 跳棋 程序 打败 了 它 的 设计 者 了 萨 纱 尔 本 人 ， 
过 了 3 年 后 ， 该 程序 已 经 可 以 击败 美国 一 个 州 的 跳棋 冠军 。 


1956 和 年， 奥利弗. 萨 尔 夫 瑞 德 (Oliver Selfridge ) 研制 出 第 一 个 字符 识别 程序 ， 
开辟 了 模式 识别 这 一 新 的 领域 。1957 年 , 纽 厄 尔 和 西蒙 等 开始 人 研究 一 种 不 依赖 于 具体 
领域 的 通用 问题 求解 需 ， 他 们 称 之 为 GPS ( General Problem Solver )。1963 年 ， 镶 姆 
斯 .斯 拉 格 ( James Slagle ) 发 表 了 一 个 符号 积分 程序 SAINT， 输 入 一 个 函数 的 表达 
式 ， 该 程序 就 能 自动 输出 这 个 冰 数 的 积分 表达 式 。 过 了 4 年 后 ， 他 们 人 研制 出 了 符号 积 
分 运算 的 升级 版 SIN，SIN 的 运算 已 经 可 以 达到 专家 级 水 准 。 


过 到 尊 儒 


所 有 这 一 切 来 得 太 快 了 ,胜利 冲 昏 了 人 工 智 能 科学 家 们 的 头脑 ,他 们 开始 盲目 乐 
观 起 来 。 例 如 ，1958 年 ， 纽 尼 尔 和 西 壹 就 日 信 满 满 地 说 ， 不 出 10 年 ， 计 算 机 将 会 成 
为 世界 象棋 冠军 ， 证 明 重 要 的 数学 定理 ， 谱 出 优美 的 首 乐 。 照 这 样 的 速度 发 展 下 去 ， 
2000 年 人 工 入 能 束 丰 的 可 以 超过 人 类 了 。 

然而 ,历史 似乎 故意 要 作弄 轻 儿 无 知 的 人 工 千 能 科学 家 们 。1965 年 ， 机 和 融 定 理 证 
明 领 域 遇 到 了 瓶 令 ， 计 算 机 推 了 数 十 万 步 也 无 法 证 明 两 个 连续 因数 之 和 仍 是 连续 天 
数 。 防 比尔 的 跳棋 程序 也 没 那 么 神气 了 ， 它 停留 在 了 州 冠 军 的 层次 ， 无 法 进一步 战胜 
世界 冠 车 。 

最 糟糕 的 事情 发 生 在 机 带 翻 幸 领 域 , 对 于 人 类 目 然 语言 的 理解 是 人 工 智能 中 的 便 
骨头 。 计 算 机 在 目 然 语言 理解 与 翻 详 过程 中 表现 得 极其 差劲 ， 一 个 最 典型 的 例子 就 是 
下 面 这 个 著名 的 英 霹 句子 : 

The spirit is willing but the flesh is weak. ( 心 有 余 而 力 不 足 。 ) 

当时 , 人 们 让 机 硕 翻 译 程序 把 这 句 话 翻译 成 俄语 , 然后 青 翻译 回 喘 语 以 检验 效果 ， 
得 到 的 句子 竟然 是 : 


The wine is good but the meet is Spoiled.(〈 酒 是 好 的 ， 肉 变质 了 。 ) 
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这 催生 是 及 展 不 对 马 跨 咏 。 怪 不 得 有 人 欣 特 过 ,类 国政 府 伦 了 2000 万 美元 为 机 
需 翻 译 控 掘 了 一 座 才 墓 。 有 关 自 然 语言 理解 的 更 多 内 容 ， 请 参见 本 书 第 10 章 。 

总 而 言 之 , 越 来 越 多 的 不 利 证 据 迫 使 政府 和 大 学 痢 减 了 人 工 智 能 的 项 目 经 费 ， 这 
使 得 人 工 贸 能 进入 了 寄 冷 的 冬天 。 来 日 各 方 的 事实 证 明 ， 人 工 稼 能 的 发 展 不 可 能 像 人 
们 早期 设想 的 那样 一 帆 风 顺 ， 人 们 必须 前 下 心 来 冷静 思考 。 


知识 丈 是 力量 


经 历 了 短暂 的 挫折 之 后 ,AI 研究 着 们 开始 痛定思痛 。 爱 德 华 ' 费 根 鲍 姆 ( Edward 
A. Feigenbaum ) 就 是 新 生 力 量 的 佼 仪 者 ,他 举 着 “知识 丈 是 力量 ”的 大 旗 ， 很 快 开 说 
了 新 的 道路 。 


费 根 鲍 姆 分 析 到 , 传统 的 人 工 智能 之 所 以 会 陷入 僵局 , 就 
是 因为 他 们 过 于 强调 通用 求解 方法 的 作用 , 而 忽略 了 具体 的 知 
识 。 仔细 思考 我 们 人 类 的 求解 过 程 束 会 发 现 , 知识 无 时 无 刻 不 
在 起 着 重要 人 作用。 因此， 人工 贸 能 必须 引入 知识 。 


于 是 , 在 费 根 饱 姆 的 带领 下 , 一 个 新 的 领域 专家 系统 诞生 
了 。 所 谓 的 专家 系统 就 是 利用 计算 机 化 的 知识 进行 自动 推理 ， 
从 而 模仿 领域 专家 解决 问题 。 第 一 个 成 功 的 专家 系统 DENDRAL ee 
于 1968 年 问世 ， 它 可 以 根据 质谱 仪 的 数据 推 知 物质 的 分 子 结 
构 。 在 这 个 系统 的 影响 下 ， 各 式 各 样 的 专家 系统 很 快 陆续 涌现 ， 形 成 了 一 种 软件 产业 
的 全 新 分 支 : 知识 产业 。1977 年 , 在 第 五 届 国 际 人 工 智能 大 会 上 ， 费 根 鲍 姆 用 知识 工 
程 概括 了 这 个 全 新 的 领域 。 


在 知识 工程 的 刺激 下 ,日 本 的 第 五 代 计 算 机 计划 、 英 国 的 阿尔 维 计划 、 西 欧 的 万 
里 卡 计划 、 美 国 的 星 计划 和 中 国 的 863 计划 陆续 推出 ， 虽 然 这 些 大 的 科研 计划 并 不 都 
是 针对 人 工 智能 的 ， 但 是 AI 都 作为 这 些 计划 的 重要 组 成 部 分 。 

然而 ， 好 景 不 长 ， 在 专家 系统 、 知 识 工程 获得 大 量 的 实践 经 验 之 后 ， 弊 端 开始 
逐渐 显现 了 出 来 ， 这 就 是 知识 获取 。 面 对 这 个 全 新 的 棘手 问题 ， 新 的 “ 费 根 饱 姆 ” 
没有 再 次 出 现 ， 人 工 智能 这 个 学 科 却 发 生 了 重大 转变 ， 它 逐渐 分 化 成 了 几 大 不 同 的 
学 派 。 
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群 龙 问 昂 (1980 一 2010) 


专家 系统 、 知 识 工 程 的 运作 和 需要 从 外 界 获 得 大 量 知识 的 输入 ,而 这 样 的 输入 工作 
是 极其 费时 费力 的 ， 这 就 是 知识 获取 的 瓶 贷 。 于 是 ， 在 20 世纪 80 年 代 ， 机 种 学 习 这 
个 原本 处 于 人 工 智 能 边 绿 地 区 的 分 文 一 下 子 成 为 了 人 们 关注 的 焦点 。 


尽管 传统 的 人 工 智 能 研究 者 也 在 奋力 撞 扎 ,但 是 人 们 很 快 发 现 ， 如 果 采 用 完全 不 
同 的 世界 观 ， 即 让 知识 通过 目下 而 上 的 方式 涌现 ， 而 不 是 让 专家 们 目 上 而 下 地 设计 出 
来 ,那么 机 可 学 习 的 问题 其 实 可 以 得 到 很 好 地 解决 。 这 就 好 比 我 们 教育 小 驴子 ,传统 
人 工 智能 好 像 填 鸭 式 教 学 ， 而 新 的 方法 则 是 局 发 式 教 学 : 让 孩子 月 己 来 学 。 


事实 上 ,在 人 工 智能 界 ， 很 早 加 有 人 提出 过 和 目下 而 上 的 涌现 智能 的 方案 ， 只 不 过 
它们 从 来 没有 引起 大 家 的 注意 。 一 批 人 认为 可 以 通过 模拟 大 脑 的 结构 ( 神经 网 络 ) 来 
实现 ， 而 另 一 批 人 则 认为 可 以 从 那些 简单 生物 体 与 环境 互动 的 模式 中 寻找 答案 。 他 们 
分 别 被 称 为 连接 学 派 和 行为 学 派 。 与 此 相对 ， 传 统 的 人 工 智能 则 被 统称 为 符号 学 派 。 目 
20 世纪 80 年 代 开 始 ， 到 20 世纪 90 年代， 这 三 大 学 派 形 成 了 了 三足鼎立 的 局 面 。 


符号 学 派 

作为 符号 学 派 的 代表 ， 人 工 智 能 的 创始 人 之 一 约翰 交 卡 
锡 在 目 己 的 网 站 上 挂 了 一 篇 文章 《什么 是 人 工 智能 放 为 大 家 盖 
明 什 么 是 人 工 乔 能 ( 按照 从 号 学 铂 的 理解 )。 


| - 区 | 


密切 相关 ， 但 人 工 智 能 的 研究 并 不 需要 局 限于 生物 学 上 可 ee 
窒 > John McCarthy 
ee (1927 一 2011) 


在 这 里 ， 寿 卡 锡 特意 强调 人 工 和 能 研究 并 不 一 定局 限于 模拟 破 实 的 生物 和 贸 能 行 
为 , 而 是 更 强调 它 的 智能 行为 和 表现 的 方面 , 这 一 点 和 图 灵 测 试 的 想法 是 一 脉 相 承 的 。 
为 外 ， 硫 卡 锡 还 突出 了 利用 计算 机 程序 来 模拟 智能 的 方法 。 他 认为 ,智能 是 一 种 特殊 
的 软件 ， 与 实现 它 的 便 件 并 没有 太 大 的 关系 。 


纽 捷 尔 和 西 索 则 把 这 种 观点 概括 为 “物理 符 扎 系统 假说 ”(physical symbolic 
system hypothesis )。 该 假说 认为 ， 任 何 能 够 将 物理 的 某 些 模式 (pattern ) 或 符号 进行 
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操作 并 转化 成 妨 外 一 些 模式 或 符号 的 系统 ， 就 有 可 能 产生 智能 的 行为 。 这 种 物理 符号 
可 以 是 通过 高 低 电 位 的 组 成 或 者 是 灯泡 的 完 灭 所 形成 的 霓虹灯 图 案 ， 当 然 也 可 以 是 人 
脑 神经 网 络 上 的 电 脉冲 信号 。 这 也 恰恰 是 “符号 学 派 ” 得 名 的 依据 。 

在 “物理 符号 系统 假说 ”的 支持 下 , 符 扎 学 小 把 焦点 集中 在 人 类 智能 的 高 级 行为 ， 
如 推理 、 规 划 、 知 识 表示 等 方面 。 这 些 工 作 在 一 些 领域 获得 了 空前 的 成 功 。 


人 机 大 战 


计算 机 博弈 (下 棋 ) 方面 的 成 功 就 是 符号 学 派 名 扬 天 下 的 资本 。 早 在 1958 年 ， 
人 工 智能 的 创始 人 之 一 西蒙 就 曾 预 言 ， 计 算 机 会 在 10 年 内 成 为 国际 象棋 世界 冠军 。 
然而 ,正如 我 们 前 面 讨 论 过 的 , 这 种 预测 过 于 乐观 了 。 事 实 比 西蒙 的 预言 足 足 晚 了 40 
年 的 时 间 。 


1988 年 , IBM 开始 研发 可 以 与 人 下 国际 象棋 的 智能 程序 “深思 ”一 一 一 个 可 以 以 
每 秒 70 万 步 棋 的 速度 进行 思考 的 超级 程序 。 到 了 1991 年 ,“ 深 思 了 "已 经 可 以 战 平 澳 
大 利 亚 国际 象棋 冠 盏 达 瑞 尔 ， 约 验 条 ( Darryl Johansen )。 19956 年 ,“ 深 思 ” 的 升级 版 
“深蓝 ”开始 挑战 著名 的 人 类 国际 象棋 世界 冠军 加 里 卡 斯 由 罗 夫 ( Garry Kasparov )， 
却 以 2:4 败 下 阵 来 。 但 是 , 一 年 后 的 5 月 11 日 ,，“ 深 蓝 ” 最 终 以 3.5:2.5 的 成 绩 战胜 了 
卡 斯 帕 罗 夫 ( 见 图 1-5 )， 成 为 了 人 工 智能 的 一 个 里 程 碑 。 


1-5 “深蓝 ”战胜 卡 斯 帕 罗 夫 ” 


人 机 大 战 终于 以 计算 机 的 胜利 划 上 了 句号 。 那 是 不 是 次 计算 机 已 经 超越 了 人 类 了 
呢 ? 要 知 直 ,计算 机 通过 超级 强大 的 搜索 能 力 险胜 了 人 类 一 一 当时 的 “ 浴 蓝 ”已 经 可 


@ 图 片 来 源 : http:/cdn.theatlantic.comystatic/mt/assets/science/kasparov615.jpg。 


以 在 1 秒 钟 内 算 两 亿 步 棋 。 而 且 , “深蓝 ”存储 了 100 年 来 几乎 所 有 的 国际 特级 大 师 
的 开局 和 残局 下 法 。 邦 外 还 有 四 位 国际 象棋 特级 大 师 杂 目 “ 训 练 ”“ 深 蓝 "， 真 可 谓 是 
超 取 华 阵容 。 所 以 ,最 终 的 结果 很 难说 是 计算 机 战胜 了 人 ， 更 像 是 一 批 人 战胜 了 为 一 
批 人 。 最 重要 的 是 ,国际 象棋 上 的 博 弃 是 在 一 个 封闭 的 棋盘 世界 中 进行 的 ， 而 人 类 稍 
能 面 对 的 则 是 一 个 复杂 得 多 的 开放 世界 。 


然而 ， 时 隔 14 年 后 ， 为 外 一 场 在 IBM 超级 计算 机 和 人 类 之 间 的 人 机 大 战 刷新 了 
记录 ,也 使 得 我 们 必须 重新 思考 机 占 是 否 能 战胜 人 类 这 个 问题 。 因 为 这 次 的 比 额 不 再 
是 下 棋 ， 而 是 自由 的 “知识 问答 ”"， 这 种 苋 赛 环 境 比 国际 象棋 开放 得 多 ， 因 为 提问 的 
知识 可 以 涵盖 时 事 、 历 史 、 文 学 、 艺 术 、 流 行文 化 、 科 学 、 体 育 、 地 理 、 文 学 游戏 等 
多 个 方面 。 因 此 , 这 次 的 机 带 胜 利 至 少 证 明了 计算 机 同样 可 以 在 开放 的 世界 中 表现 得 
不 进 于 人 类 。 


这 上场 人 机 大 战 的 游戏 叫 作 《人 危险 》( Jeopardy )， 是 美国 一 球 着 名 的 电视 方 上 日。 在 
方 目 中 ,主持 人 通过 目 然 语言 给 出 一 系列 线索 ,然后 ， 参 宪 队 员 要 根据 这 些 线 索 用 最 
短 的 时 间 把 主持 人 描述 的 人 或 者 事物 猜 出 来 ,并且 以 提问 的 方式 回答 。 例 如 当 市 日 主 
持 人 给 出 线索 "这 是 一 种 冷血 的 无 足 的 冬眠 动物 ”的 时 候 , 选手 应 该 回答 “什么 是 蛇 ?” 
而 不 是 简单 地 回答 “ 蛇 ”"。 由 于 问题 会 涉及 各 个 领域 ， 所 以 一 般 知 识 洲 博 的 人 类 选手 
都 很 难 获胜 。 


然而 , 在 2011 年 2 月 14 日 到 2 月 16 日 期 间 的 《和 危险》 比赛 中 , IBM 公司 的 超级 
计算 机 沃 和 森 (Watson ) 却 战 胜 了 人 类 选手 ( 见 图 1-6 )。 
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1-6” 沃 森 正 在 与 人 类 选手 一 起 玩 《 危 险 》 游 戏 ” 


@ 图片 来 源 : http://cdn.geekwire.com/wp-content/uploads/IBM-Watson.jpg。 
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这 一 次 , IBM 打造 的 沃 征 是 一 球 完 全 不 同 于 以 往 的 机 条。 痛 完 ， 它 必须 是 一 个 目 
然 语 言 处 理 的 高 手 ， 因 为 它 必 须 在 短 时 间 内 理解 主持 人 的 提问 ,其 至 有 的 时 候 还 必须 
理解 语言 中 的 隐 含 意思 。 而 正如 我 们 前 文 所 说 ， 目 然 语言 理解 始终 是 人 工 智能 的 最 大 
难题 。 其 次 ， 敖 森 必 须 充 分 了 解 字 於 ， 要 领会 双关 语 ， 并 且 脑 中 还 要 雄 满 诸如 沙 士 比 
亚 戏 剧 的 独白 、 全 球 主要 的 河流 和 各 国 衣 都 等 知识 ， 所 有 这 些 知 识 并 不 限定 在 某 个 具 
体 的 领域 。 所 以 ， 沃 森 的 胜利 的 确 是 人 工 智能 界 的 一 个 标志 性 事件 。 


可 以 说 ， 人 机 大 战 是 人 工 智能 符号 学 派 1980 年 以 来 最 出 风头 的 应 用 。 然 而 ， 这 
种 无 休止 的 人 机 大 成 也 难 逃 成 为 嗪 头 的 嫌疑 。 事 实 上 , 历史 上 每 次 吸引 眼球 的 人 机 大 战 
似乎 部 必然 伴随 着 IBM 公司 的 股票 大 涨 ， 这 也 束 不 难 理解 为 什么 IBM 会 花 重 金 开 发 出 
一 球 又 一 球 大 型 计算 机 去 参加 这 么 多 无 聊 的 苋 赛 ， 而 不 是 去 做 一 些 更 实用 的 东西 了 。 


实际 上 ，20 世纪 80 年 代 以 后 ， 符 号 学 派 的 发 展 势 尖 已 经 远 不 如 当年 了 了， 因为 人 
工 知 能 武林 吉 主 的 地 位 很 快 就 属于 其 他 学 派 了 。 


连接 学 派 

我 们 知道 ， 人 类 的 知 匡 主要 来 源 于 大 脑 的 活动 ， 而 大 脑 则 是 由 一 万 亿 个 神经 元 细 
胞 通过 错综复杂 的 相互 连接 形成 的 。 于 是 ， 人 们 很 自然 地 想到 ， 我 们 是 否 可 以 通过 模 
拟 大 量 神经 元 的 集体 活动 来 模拟 大 脑 的 智力 呢 ? 

对 比 物理 符号 系统 假说 ,我 们 不 难 发 现 ， 如 果 将 智力 活动 比喻 成 一 丈 软 件 ， 那 么 
支撑 这 些 活 动 的 大 脑 神经 网 络 束 是 相应 的 硬件。 于 是 ,主张 神 经 网 络 研 究 的 科学 家 实 
际 上 在 强调 便 件 的 作用 ， 认 为 高 级 的 智能 行为 是 从 大 量 神经 网 络 的 连接 中 目 发 出 现 
的 ， 因 此 ， 他 们 又 被 称 为 连接 学 铂 。 

神经 网 络 

连接 学 小 的 发 展 也 是 一 波 三 折 。 事 实 上 ， 最 早 的 神经 网 络 人 研究 可 以 追溯 到 1943 
年 计算 机 发 明之 前 。 当 时 ， 沃 伦 . 考 卡 洛克 (Warren McCulloch ) 和 话 尔 特 ， 匹 效 
(Walter Pitts ) 二 人 提出 了 一 个 单个 神经 元 的 计算 模型 ， 如 图 1-7 所 示 。 


在 这 个 模型 中 ， 左 边 的 五 ,PP ,Iw 为 输入 单元 ， 可 以 从 其 他 神经 元 接受 输出 ， 然 
后 将 这 些 信号 经 过 加 权 (Wy, W,… ,Ww ) 传递 给 当前 的 神经 元 并 完成 汇总 。 如 采 汇 总 
的 输入 信息 强度 超过 了 一 定 的 国 值 (7)， 则 该 神经 元 就 会 发 放 一 个 信号 y 给 其 他 神经 
元 或 者 直接 输出 到 外 界 。 该 模型 后 来 被 称 为 麦 卡 洛克 - 匹 效 模型 ， 可 以 说 它 是 第 一 个 
真实 神经 元 细胞 的 模型 。 


输入 加 权 


1-7 妻 卡 洛克 和 匹 兹 的 神经 元 模型 


1957 年 ， 弗 兰 克 “' 罗 和 森 布 拉 特 (Frank Rosenblatt ) 对 麦 卡 洛克 - 匹 效 模 型 进行 了 
扩充 ， 即 在 麦 卡 洛克 - 匹 效 神经 元 上 加 入 了 学 习 算法 , 扩充 的 模型 有 一 个 啊 腕 的 名 学 : 
感知 机 。 感 知 机 可 以 根据 模型 的 输出 yy 与 我 们 希望 模型 的 输出 y* 之 间 的 误差 , 调整 权 
重 所 , 7,…, Ww 来 完成 学 习 。 


我 们 可 以 形象 地 把 感知 机 模型 理解 为 一 个 装 满 了 大 大 小 小 水 龙头 ( 所, 画 ,…， 
Wy ) 的 水 管 网 络 , 学 习 算 法 可 以 调节 这 些 水 龙头 来 控制 最 终 输出 的 水 流 ,， 并 让 它 达 到 
我 们 想 要 的 流量 ， 这 就 是 学 习 的 过 程 。 这 样 ， 感 知 机 就 好 像 一 个 可 以 学 习 的 小 孩 , 无 
论 什么 问题 ， 只 要 明确 了 我 们 想 要 的 输入 和 输出 之 间 的 关系 ,都 可 能 通过 学 习 得 以 解 
决 ， 至 少 它 的 拥护 者 是 这 样 认为 的 。 

然而 , 好 景 不 长 ，1969 年 ， 人 工 智能 界 的 权威 人 士 马 文 ， 闵 斯 基 给 连接 学 派 带 来 
了 致命 一 击 。 他 通过 理论 分 析 指出 ,感知 机 并 不 像 它 的 创立 者 罗 森 布 拉 特 宣称 的 那样 
可 以 学 习 任何 问题 。 连 一 个 最 简单 的 问题 : 判断 一 个 两 位 的 二 进 制 数 是 否 仅 包含 0 或 
者 1( 即 所 谓 的 XOR 问题 ) 都 无 法 完成 。 这 一 打击 是 致命 的 , 本 来 就 不 是 很 热 的 神经 
网 络 研究 差点 就 被 闵 斯 基 这 一 棒子 打 死 了 。 

多 则 不 同 

1974 年 ， 人 工 智能 连接 学 派 的 救世 主 杰 夫 : 辛 顿 ( Geoffrey 
Hinton ) 终于 出 现 了 。 他 曾 至 少 两 次 挽回 连接 学 派 的 败局 ，1974 
年 是 第 一 次 , 第 二 次 会 在 下 文 提 到 。 辛 顿 的 出 发 点 很 简单 一 “多 
则 不 同 ”: 只 要 把 多 个 感知 机 连接 成 一 个 分 层 的 网 络 , 那么 , 它 就 
可 以 圆满 地 解决 六 斯 基 的 问题 。 如 图 1-8 所 示 ， 多 个 感知 机 连接 
成 为 一 个 四 层 的 网 络 ， 最 左面 为 输入 层 ， 最 右面 为 输出 层 ， 中 间 Geofirey Hinton 
的 那些 神经 元 位 于 隐 含 层 , 右 侧 的 神经 元 接受 左 侧 神经 元 的 输出 。 0 
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第 一 个 隐 含 层 第 二 个 隐 含 层 
图 1-8 多 层 感 知 机 


但 接 下 来 的 问题 是 ,“ 人 多 吃 得 多 ", 那么 多 个 神经 元 ,可 能 有 几 百 甚至 上 千 个 参 
数 需 要 调 太 ,我 们 如 何 对 这 样 复 杂 的 网 络 进行 训练 呢 ? 芋 顿 等 人 发 现 ， 采 用 几 年 前 阿 
薄 布 赖 条 (Arthur Bryson ) 等 人 提出 来 的 反 向 传播 算法 ( Back propagation algorithm ， 
简称 BP 算法 ) 就 可 以 有 效 解决 多 层 网 络 的 训练 问题 。 


还 是 以 水 流 管 这 为 例 来 说 明 。 当 网 络 执行 决策 的 时 候 , 水 从 左 侧 的 输入 节点 往 右 
流 ， 直 到 输出 节点 将 水 吐出 。 而 在 训练 阶段 ， 我 们 则 需要 从 右 往 左 来 一 层 层 地 调 下 各 
个 水 龙头 ， 要 使 水 流量 达到 要 求 ， 我 们 只 要 让 每 一 层 的 调节 只 对 它 右 面 一 层 的 节点 负 
责 就 可 以 了 ,这 就 是 反问 传播 算法 。 事 实证 明 ， 多 层 神经 网 络 狐 备 上 反问 传播 算法 之 
后 ， 可 以 解决 很 多 复杂 的 识别 和 预测 等 问题 。 

几乎 是 在 同一 时 间 ， 又 有 几 个 不 同 的 神经 网 络 模 型 先后 被 提 出 ,这 些 模 型 有 的 可 
以 完成 模式 肾 类 ， 有 的 可 以 模拟 联想 思维 ， 有 的 具有 诬 厚 的 数 竺 物理 基础 ， 有 的 则 模 
仿生 物 的 构造 。 所 有 这 些 大 的 突破 都 令 连接 学 派 名 声 大 品 ， 异 车 突起 。 

统计 学 习 理 论 

然而 , 连接 学 派 的 科学 家 们 很 快 又 陷入 了 困境 ,里 然 各 种 神经 网 络 可 以 解决 问题 ， 
但 是 ,它们 完 竟 为 什么 会 成 功 以 及 为 什么 在 有 些 问 题 上 会 屡 遭 失败 ， 却 没有 人 能 说 得 
清楚 。 对 网 络 运行 原理 的 无 知 ， 也 使 得 人 们 对 如 何 提高 神经 网 络 运行 效 率 的 问题 无 从 
下 手 。 因 此 ， 连 接 和 学派 需要 理论 的 文 持 。 


2000 年 左右 ， 弗 拉 基 米尔 .万 普 尼 殉 ( Vladimir 
Naumovich Vapnik ) 和 亚 历 克 蹇 : 泽 范 兰 杰 斯 ( Alexey 
Yakovlevich Chervonenkis ) 这 两 位 俄罗斯 科学 家 提出 了 一 
整套 新 的 理论 : 统计 学 习 理 论 ,受到 连接 学 涛 的 顶礼 膜拜 。 


该 理论 大 意 可 概括 为 “ 杀 鸡 融 用 等 牛刀 ”。 我 们 的 模 
型 一 定 要 与 竺 解决 的 问题 相 匹 配 ， 如 果 模 型 过 于 简单 ， 而 
问题 本 映 的 复杂 度 很 高 ,就 无 法 得 到 预期 的 精度 。 反 过 来 ， 
各 问题 本 吴 简 单 ， 而 模型 过 于 复杂 , 那么 模型 就 会 比较 从 和 “pm 
死 , 无 法 举一反三 ， 即 出 现 所 请 的 “过 拟 合 ”( overfitting ) 
现象 。 


实际 上 ， 统 计 学 习 理 论 的 精神 与 奥 卡 姆 剃刀 原理 有 着 深刻 的 联系 。 威 廉 ' 奥 卡 姆 
( William Occum，1287 一 1347 ) 是 中 世纪 时 期 的 著名 哲学 家 ， 他 留 下 的 最 重要 的 遗产 
就 是 奥 卡 姆 剃刀 原理 。 该 原理 说 ， 如 果 对 于 同一 个 问题 有 不 同 的 解决 方案 ， 那 么 我 们 
应 该 挑选 其 中 最 简单 的 一 个 。 神 经 网 络 或 者 其 他 机 硕 学 习 模 型 也 应 该 苯 循 类 似 的 原理 ， 
只 有 当 模 型 的 复杂 度 与 所 解决 的 问题 相 匹配 的 时 候 ， 才 能 让 模型 更 好 地 发 挥 作 用 。 


然而 ， 统 计 学 习 理 论 志 有 很 大 的 局 限 性 ， 因 为 理论 的 严格 分 析 仅 仅 限 于 一 类 特殊 
的 神经 网 络 模型 : 支持 向 量 机 (Supporting Vector Machine )。 而 对 于 更 一 般 的 神经 网 
络 ， 人 们 还 未 找到 统一 的 分 析 方 法 。 所 以 说 ， 连 接 学 派 的 科学 家 们 虽然 会 器 大 脑 学 习 
如 何 构造 神经 网 络 模型 ， 但 实际 上 他 们 目 己 也 不 清楚 这 些 神经 网 络 究竟 是 如 何 工作 
的 。 不 过 ,他 们 这 种 妨 众 局 面 也 是 无 独 有 偶 ， 另 外 一 小 后 起 之 秀 虽 然 来 势 济济 ， 却 也 
没有 解决 理论 基础 问题 ， 这 就 是 行为 学 派 。 


行为 学 派 

行为 学 派 的 出 发 点 与 从 号 学 派 和 连接 竺 派 完 全 不 同 , 他 们 并 没有 把 目光 聚焦 在 具 
有 蜗 级 乔 能 的 人 类 里 上 ， 而 是 关注 比 人 类 低级 得 多 的 昆虫 。 即 使 这 样 简 单 的 动物 也 体 
现 出 了 非凡 的 智能 ， 昆 虫 可 以 灵活 地 摆动 目 己 的 号 体 行走 ， 还 能 够 快速 地 反应 ， 躲 避 
捕食 者 的 攻击 。 而 另 一 方面 ， 尽 管 蚂 下 个 体 非 稼 简单 ， 但 是 ， 当 很 多 小 蚂蚁 聚集 在 一 
起 形成 庞大 的 蚁 群 的 时 候 ， 却 能 表现 出 非凡 的 智能 ， 还 能 形成 严密 的 社会 分 工 组 织 。 


正 是 受到 了 目 然 界 中 这 些 相 对 低 等 生物 的 局 发 , 行为 学 派 的 科学 家 们 决定 从 简单 
的 昆虫 入手 来 理解 智能 的 产生 。 的 确 ， 他 们 取得 了 不 错 的 成 末 。 
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机 顺 昆 虫 

罗 德 尼 . 布鲁克 斯 (Rodney Brooks ) 是 一 名 来 自 美 国 态 省 
理工 学 院 的 机 带 人 专家 。 在 他 的 实验 室 中 有 大 量 的 机 带 昆 虫 ( 如 
图 1-9 所 示 )。 相 对 于 那些 物 抽 的 机 圳 人 铁 家 伙 来 说 ， 这 些小 昆 
虫 要 灵活 得 多 。 


这 些 机 大 昆虫 没有 复杂 的 大 脑 ， 也 不 会 按照 传统 的 方式 进 
行 复 茶 的 知识 表示 和 推理 。 它 们 甚至 不 需要 大 脑 的 干预 ， 仅 攒 
四 股 和 关 市 的 协调 ， 束 能 很 好 地 适应 环境 。 当 我 们 把 这 些 机 厅 a 
昆虫 放 到 复 茶 的 地 形 中 的 时 候 ， 它 们 可 以 痛快 地 改行 ， 还 能 聪 
明 地 避 开 隐 碍 物 。 它 们 看 起 来 的 智能 事实 上 并 不 来 源 于 目 上 而 下 的 复杂 设计 ， 而 是 来 
源 于 目下 而 上 的 与 环境 的 互动 。 这 如 是 布 鲁 死 斯 所 倡导 的 理念 。 


1-9 机 器 昆虫 Walkman' 


如 果 说 符号 学 涛 模拟 知 能 软件 ， 连 接 学 小 模拟 大 脑 便 件 ， 那 么 行为 学 派 就 算是 模 
拟 有 身体 了 ， 而 且 是 简单 的 、 看 起 来 没有 什么 智能 的 身体 。 例 如 ， 行 为 学 小 的 一 个 非常 
成 功 的 应 用 就 是 美国 波士顿 动力 公司 ( Boston Dynamics ) 人 研制 开发 的 机 器 人 “大 狗 ”%。 
如 图 1-10 所 示 ,“ 大 狗 ” 是 一 个 四 足 机 各 人 ， 它 能 够 在 各 种 复杂 的 地 形 中 行走 、 枕 扑 、 


QD) 图 片 来 源 : http://grant.solarbotics.net/walkman.htm。 
@) BigDog， 人 参见 http:/www.bostondynamics.com/robot_ bigdog.html。 
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奔跑 ,甚至 还 可 以 背 人 负重 物 。“ 大 狗 ” 模 拟 了 四 足 动物 的 行走 行为 ,能够 日 适应 地 根据 
不 同 的 地 形 调整 行走 的 模式 。 推 荐 感 兴趣 的 谈 者 扫描 下 方 二 维 码 观看 视频 介绍 。 


i = 本 


1-10 ”行走 在 雪 地 上 的 “大 狗 ”” 


当 这 只 大 狗 伴随 春 “沙沙 ”的 机 带 运作 声 对 你 走 来 时 ， 你 一 定 会 被 它 的 气 荔 所 吓 
到 ， 因 为 它 的 样子 很 像 是 一 头 公 牛 呢 ! 

进化 计算 

我 们 从 生物 号 上 学 到 的 东西 还 不 仅仅 是 这 些 。 从 更 长 的 时 


间 尺 度 看 , 生物 体 对 环境 的 适应 还 会 迫使 生物 进化 ,从 而 实现 
从 简单 到 复杂 、 从 低 等 到 高 每 的 跃迁 。 


约翰 * 堆 兰 (John Holland ) 是 美国 密 西 根 大 学 的 心理 学 、 
电大 工程 以 及 计算 机 的 三 科教 授 。 他 本 科 毕 业 于 麻 省 理工 学 
院 ， 后 来 到 了 密 西 根 大 学 师 从 阿 蕊 : 伯 克 斯 ( Arthur Burks， eet 
曾 是 冯 ， 详 依 曼 的 助手 ) 攻读 博士 学 位 。1959 年 ， 他 拿 到 了 
全 世界 首 个 计算 机 科学 的 博士 头衔 。 别 看 截 兰 个 头 不 高 ， 他 的 骨子里 却 有 一 种 离 经 叛 
着 的 气魄 。 他 在 读 博 期 间 就 对 如 何 用 计算 机 模拟 生物 进化 异 稼 着 迷 ， 并 最 终 发 表 了 他 
的 遗传 算法 。 


遗传 算法 对 大 日 然 中 的 生物 进化 进行 了 大 胆 的 抽象 ， 最 终 提 取出 两 个 主要 环 市 : 


Q) 图 片 来 源 : http://www.militaryfactory.com/armor/detail.asp?armor id=184。 
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变异 (包括 基因 重组 和 突变 ) 和 选择 。 在 计算 机 中 ， 我 们 可 以 用 一 堆 二 进 制 串 来 模拟 
目 然 界 中 的 生物 体 。 而 大 目 然 的 选择 作用 一 一 生存 竞争 、 优 胜 劣 汰 一 一 则 被 抽象 为 一 
个 测 单 的 适应 度 冰 数 。 这 样 ， 一 个 超级 浓缩 版 的 大 目 然 进化 过 程 就 可 以 搬 到 计算 机 中 
了 ， 这 就 是 遗传 算法 。 

遗传 算法 在 刚 发 表 的 时 候 并 没有 引起 多 少 人 的 重视 。 然 而 ， 随 着 时 间 的 推移 ， 当 
人 工 智能 的 焦点 转 癌 机 融 学 习 时 ， 遗 传 算法 就 一 下 子 家 喻 户 晓 了 ， 因 为 它 的 确 是 一 个 
非常 简单 而 有 效 的 机 带 学 习 算 法 。 与 神经 网 络 不 同 ， 遗 传 算法 不 需要 把 学 习 区 分 成 训 
练 和 执行 两 个 阶段 , 它 完 全 可 以 指导 机 融 在 执行 中 学 习 , 即 所 谓 的 做 中 学 (learning by 
doing )。 同 时 ， 壮 传 算法 比 神经 网 络 具 有 更 方便 的 表达 性 和 简单 性 。 


无 独 有 个， 美国 的 劳伦斯 福 格 尔 ( Lawrence Fogel )、 德 国 的 因 戈 : 雷 伯 格 ( Ingo 
Rechenberg ) 以 及 汉 斯 .保罗 施 韦 费 尔 (Hans-Paul Schwefel )、 霍 兰 的 学 生 约 其 科 扎 
(John Koza ) 等 人 也 先后 提出 了 演化 策略 、 演 化 编程 和 遗传 编程 。 这 使 得 进化 计算 大 
家 庭 的 成 员 更 加 多 样 化 了 。 


人 工 生命 


无 论 是 机 需 昆 虫 还 是 进化 计算 , 科学 家 们 关注 的 焦点 都 是 如 何 模 仿生 物 来 创造 入 
能 的 机 大 或 者 算法 。 克 里 斯 托 弗 . 兰 顿 ( Chirstopher Langton ) 进行 了 进一步 提炼 ， 提 
出 了 “人 工 生 命 ” 这 一 新 兴学 科 。 人 工 生命 邱 人 工 智能 非常 接近 ， 但 是 它 的 关注 点 在 
于 如 何 用 计算 的 手段 来 模拟 生命 这 种 更 加 “ 低 等 ”的 现象 。 

人 工 生命 认为 ,所 谓 的 生命 或 者 智能 实际 上 是 从 底层 单元 ( 可 以 是 大 分 子 化 合 物 ， 
也 可 以 是 数字 代码 ) 通过 相互 作用 而 产生 的 涌现 属性 ( emergent property )。“ 消 现 ” 
(emergence ) 这 个 词 是 人 工 生命 研究 中 使 用 频率 最 高 的 词 之 一 ， 它 强调 了 一 种 只 有 在 
宏观 具备 但 不 能 分 解 还 原 到 微观 层次 的 属性 、 特 征 或 行为 。 单 个 的 和 蛋 日 质 分 子 不 具备 
生命 特征 ,但 是 大 量 的 和 蛋白质 分 子 组 合 在 一 起 形成 细胞 的 时 候 ， 整 个 系统 就 具备 了 
“ 活 ” 性 ， 这 就 是 典型 的 涌现 。 同 样 地 ， 智 能 则 是 比 生命 更 高 一 级 ( 假如 我 们 能 够 将 
智能 和 生命 分 成 不 同等 级 的 话 ) 的 涌现 一 一 在 生命 系统 中 义 涌现 出 了 一 整套 神经 网 络 
系统 ， 从 而 使 得 整个 生命 体 具备 了 智能 属性 。 现 实 世 界 中 的 生命 是 由 碳水 化 合 物 编 织 
成 的 一 个 复杂 网 络 ， 而 人 工 生 命 则 是 寄生 于 01 世界 中 的 复杂 有 机 体 。 

人 工 生命 的 研究 思路 是 通过 模拟 的 形式 在 计算 机 数码 世界 中 产生 类 似 现实 世界 
的 涌现 。 因 此 ， 从 本 质 上 讲 ， 人 工 生命 模拟 的 就 是 涌现 过 程 ， 而 不 太 关 心 实现 这 个 过 
程 的 具体 单元 。 我 们 用 01 数字 代表 蛋白质 分 子 ， 并 为 其 设置 详细 的 规则 ， 接 下 来 的 


事情 承 是 运行 这 个 程序 ， 然 后 盯 看 屏幕 ， 喝 上 一 杯 咖 啡 ， 等 待 着 令 人 吃 司 的 “生命 现 
象 ”在 电脑 中 出 现 。 

模拟 群体 行为 是 人 工 生命 的 典型 应 用 之 一 。1983 年 ,计算 机 图 形 学 家 克 雷 格 ' 雷 
诡 效 (CraigReynolds ) 曾 开 发 了 一 个 名 为 Boid 的 计算 机 模拟 程序 ( 见 几 1-11 )， 它 可 
以 通 真 地 模拟 鸟 群 的 运动 ， 还 能 够 聪明 地 躲避 障碍 物 。 后 来 ， 肯 尼 迪 〈Kennedy ) 等 
人 于 1995 年 扩展 了 Boid 模型 ， 提 出 了 PSO ( 粒子 群 优化 ) 算法 ， 成功 地 通过 模拟 乌 
群 的 运动 来 解决 函数 优化 等 问题 。 


1-11 三 维 的 人 工 生命 Boid 模型 


类 似 地 ,利用 模拟 群体 行为 来 实现 智能 设计 的 例子 还 有 很 多 ,例如 蚁 群 算 法 、 人 免 
疫 算法 等 ， 共 同 特 征 都 是 让 智能 从 规则 中 自 下 而 上 地 涌现 出 来 ， 并 能 解决 实际 问题 。 
关于 人 工 生 命 的 详细 讨论 ， 可 以 参考 本 书 11 ~ 13 章 。 

然而 ,行为 学 派 带 来 的 问题 似乎 比 提供 的 解决 方法 还 多 。 究 竟 在 什么 情况 下 能 够 
发 生 涌 现 ? 如 何 设计 底层 规则 使 得 系统 能 够 以 我 们 和 希望 的 方式 涌现 ?” 行为 学 派 、 人 工 
生命 的 研究 者 们 无 法 回答 。 更 糟糕 的 是 ， 几 十 年 过 去 了 ， 人 工 生命 研究 似乎 仍然 只 擅 
长 于 模拟 小 虫子 、 蚂 蚊 之 类 的 低 等 生物 ， 高 级 的 智能 完全 没有 像 他 们 预期 的 那样 月 然 
涌现 ， 而 且 没 有 丝毫 迹象 。 


三 大 学 派 间 的 关系 


正如 我 们 前 面 提 到 的 ,这 三 个 学 派 大 致 是 从 软件 、 人 硬件 和 吴 体 这 三 个 角度 来 模拟 
和 理解 智能 的 。 但 是 ， 这 仅仅 是 一 个 粗糙 的 比喻 。 事 实 上 ， 三 大 学 涛 之 间 还 存在 着 很 


Q) 图 片 来 源 : http://www.red3d.com/cwr/boids/。 
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多 微妙 的 差异 和 联系 。 


自 完 ， 符号 学 派 的 思想 和 观点 直接 继承 上 自 图 录 , 他 们 是 耳 接 从 功能 的 角度 来 理解 
镶 能 的 。 他 们 把 千 能 理解 为 一 个 黑箱 ， 只 关心 这 个 黑箱 的 输入 和 输出 ， 而 不 关心 黑箱 
的 内 部 构造 。 因 此 ， 符 号 学 派 利 用 知识 表示 和 搜索 来 百代 真实 人 脑 的 神经 网 络 结构 。 
和 从 号 学 铂 假 设 知识 是 先 验 地 存储 于 黑箱 之 中 的 ， 因此, 它 很 撞 长 解决 利用 现 有 的 知识 
做 比较 复杂 的 推理 、 规 划 、 逻 辑 运 算 和 判断 等 问题 。 


连接 学 小 则 显然 要 把 智能 系统 的 黑箱 打开 ， 从 结构 的 角度 来 模拟 智能 系统 的 运 
作 ， 而 不 单单 重 现 功 能 。 这 样 ， 连 接 学 小 看 行 智能 会 比 符 亏 学 派 更 加 帮 层 。 这 样 做 的 
好 处 是 可 以 很 好 地 解决 机 带 学 习 的 问题 ， 并 目 动 获取 知识 ; 但 是 轮 点 是 对 于 知识 的 表 
述 是 隐 含 而 具 汐 的 ， 因 为 所 有 学 习 到 的 知识 午 变 成 了 连接 权重 的 数值 。 我 们 在 要 该 出 
神经 网 络 中 存储 的 知识 ， 承 必须 要 让 这 个 网 络 运作 起 来 ， 而 无 法 直接 从 模型 中 该 出 。 
连接 学 小 擅长 解决 模式 识别 、 聚 类 、 联 想 等 非 结构 化 的 问题 ， 但 却 很 难 解决 高 层次 的 
智能 问题 ( 如 机 右 定 理 证 明 )。 


行为 学 派 则 研究 更 低级 的 智能 行为 ， 它 更 擅长 模拟 身体 的 运作 机 制 ， 而 不 是 脑 。 
同时 , 行为 学 派 非常 强调 进化 的 作用 ,他们 认为 ,， 人 类 的 智 六 也 理应 是 从 漫长 的 进化 
过 程 中 逐渐 读 变 而 来 的 。 行 为 学 派 擅 长 解决 适应 性 、 学 习 、 快 速 行 为 反应 等 问题 ， 也 
可 以 解决 一 定 的 识别 、 聚 类 、 联 想 等 问题 ， 但 在 高 级 智能 行为 《如 问题 求解 、 逻 辑 演 
算 ) 上 则 相形 见 绕 。 


有 意思 的 是 ,连接 学派 和 行为 学 铂 似 乎 更 加 接近 ,因为 他 们 虱 相 信 智 能 是 目下 而 
上 涌现 出 来 的 ， 而 非 目 上 而 下 的 设计 。 但 麻烦 在 于 ， 怎 么 涌现 ? 清 现 的 机 制 是 什么 ? 
这 些 深 层次 问题 无 法 在 两 大 学 派 内 部 解决 ， 而 必须 求助 于 复杂 系统 科学 。 


三 大 学 派 分 别 从 高 、 中 、 低 三 个 层次 来 模拟 智能 ,但 现实 中 的 智能 系统 显然 古 一 
个 完整 的 整体 。 我 们 应 如 何 调解 、 综 合 这 三 大 学 派 的 观点 呢 ?” 这 是 一 个 未 解决 的 开放 
问题 ， 而 且 似 乎 很 难 在 短 时 间 内 解决 。 主 要 的 原因 在 于 ,无 论 是 在 理论 指导 思想 还 是 
计算 机 模型 等 方面 ， 三 大 学 派 部 存在 看 太 大 的 差 寞 。 


于 是 ， 就 这 样 兢 兢 磁 磁 地 ， 人 工 智 能 走 入 了 新 的 世纪 。 到 了 2000 年 前 后 ， 人 工 
智能 的 发 展 非但 没有 解决 问题 ， 反 而 引入 了 一 个 又 一 个 新 的 问题 ， 这 些 问 题 似乎 变 得 


越 来 越 难以 回答 ， 而 且 所 奉 扯 的 理论 也 越 来 越 深 。 于 是 ,很 多 人 工 和 前 能 人 研究 者 干脆 当 
起 了 “能 乌 "， 对 理论 问题 不 闻 不 问 ， 而 是 一 心 回 “应 用 ”看 齐 。 争 什么 争 呀 ， 实 上 践 
是 检验 真理 的 唯一 标准 , 无 论 是 符号 、 连 接 、 行 为 , 能 够 解决 实际 问题 的 乌 就 是 好 乌 。 
群 龙 无 首 

在 这 样 一 种 大 背景 下 ， 人 工 智能 开始 进一步 分 化 , 很 多 原本 隶属 于 人 工 智能 的 领 
域 逐 渐 独 立成 为 面 回 具体 应 用 的 新 兴学 科 ， 我 们 人 简单 罗列 如 下 : 

口 自动 定理 证 明 

口 模式 识别 

口 机 大 学 习 

口 自然 语言 理解 

口 计算 机 视觉 

口 自动 程序 设计 

每 一 个 领域 都 包含 大 量具 体 的 技术 和 专业 知识 以 及 特殊 的 应 用 背景 , 不 同 分 支 之 
间 也 几乎 是 老死 不 相 往 来 ， 大 一 统 的 人 工 智 能 之 梦 仿 佛 破灭 了 。 于 是 ， 计 算 机 视觉 
家 甚至 不 愿意 承认 自己 摘 的 叫 人 工 智能 ， 因 为 他 们 认为 ， 人工 智 能 已 经 成 为 了 一 个 仅 
仅 代 表 传 统 的 符号 学 派 观 点 的 专 有 名 词 ， 大 一 统 的 人 工 智 能 概念 没有 任何 意义 ， 也 没 
有 存在 的 必要 。 这 就 是 人 工 智能 进入 2000 年 之 后 的 状况 。 


贝 叶 斯 统计 

但 是 ， 世 界 总 是 那么 奇妙 ， 少 数 派 总 是 存在 的 。 当 人 工 智 能 正面 临 着 士 朋 瓦解 的 
窗 境 时 ， 人 仍然 有 少数 科学 家 正在 逆流 而 动 ， 试 图 重新 构建 统一 的 模式 。 

厅 省 理工 学 院 的 乔 希 . 特 南 饱 姆 ( Josh Tenenbaum ) 以 及 斯 坦 福 大 学 的 达 关 妮 . 科 
勒 (DaphneKoller ) 就 是 这 样 的 少数 派 。 他 们 的 特 立 独行 起 源 于 对 概率 这 个 有 着 几 百 
年 历史 的 数学 概念 的 重新 认识 ， 并 利用 这 种 认识 来 统一 人 工 智 能 的 各 个 方面 ， 包 括 学 
习 、 知 识 表 示 、 推 理 以 及 决策 。 

这 样 的 认识 其 实 可 以 追溯 到 一 位 18 世纪 的 古人 ， 这 就 是 著名 的 牧师 、 业 余数 学 
家 : 托马斯 . 贝 叶 斯 (Thomas Bayes )。 与 传统 的 方法 不 同 ， 贝 叶 斯 将 事件 的 概率 视 
为 一 种 主观 的 信念 ， 而 不 是 传统 意义 上 的 事件 发 生 的 频率 。 因 此 ， 概 率 是 一 种 主观 的 
测度 ， 而 非 客 观 的 度量 。 故 而 ， 人 们 也 将 贝 叶 斯 对 概率 的 看 法 称 为 主观 概率 学 派 
这 一 观点 更 加 明确 地 凸显 出 贝 叶 斯 概率 与 传统 概率 统计 的 区 别 。 
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贝 叶 斯 学 派 的 核心 就是 著名 的 贝 叶 斯 公式 , 它 表 达 了 智能 主体 如 何 根据 搜集 到 的 
言 县 改变 对 外 在 事物 的 看 法 。 因 此 ， 贝 叶 斯 公式 概括 了 人 们 的 学 习 过 程 。 以 贝 叶 斯 公 
式 为 基础 ， 人 们 发 展 出 了 一 整合 称 为 贝 叶 斯 网 络 (示例 见 图 1-12 ) 的 方法 。 在 这 个 网 
络 上 ， 研 究 者 可 以 展开 对 学 习 、 知 识 表示 和 推理 的 各 种 人 工 镶 能 的 全 究 。 随 着 大 数据 
时 代 的 来 临 ， 贝 叶 斯 方法 所 需要 的 数据 也 是 唾 手 可 得 ,这 使 得 贝 叶 斯 网 络 成 为 了 人 们 
天 注 的 焦点 。 
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图 1-12 ” 贝 叶 斯 网 络 示 例 ” 


通用 人 工 智能 


另外 一 个 答 试 统一 人 工 智能 的 学 者 是 澳大利亚 国立 大 学 的 马 库 斯 : 明 特 (Marcus 
Hutter )， 他 在 2000 年 的 时 候 就 开始 尝试 建立 一 个 新 的 学 科 ， 并 为 这 个 新 学 科 取 了 一 
个 啊 当 当 的 名 字 : 通用 人 工 智能 ( Universal Artificial Intelligence )。 

明 特 认为 ， 现 在 主流 的 人 工 智 能 人 研究 已 经 严重 偏离 人 工科 
能 这 个 名 称 的 本 意 。 我 们 不 应 该 将 智能 化 分 成 学 习 、 认 知 、 决 
宽 、 推 理 等 分 立 的 不 同 侧面 。 事 实 上 ， 对 于 人 类 来 说 ， 所 有 这 
些 功 能 都 是 智能 作为 一 个 整体 的 不 同 表现 。 因 此 ， 在 人 工 智能 
中 ， 我 们 应 该 始终 保持 清醒 的 头脑 ， 将 智能 看 作 一 个 整体 ， 而 Marcus Hutter 
不 是 若干 分 离 的 子 系统 ， WE 


如 果 非 要 坚持 统一 性 和 广泛 性 ， 那么 我 们 就 不 得 不 放弃 理论 上 的 实用 性 ,这 恰恰 
正 是 明 特 的 宁 略 。 与 通常 的 人 工 入 能 人 研究 非常 不 同 ， 胡 特 采 用 的 是 规范 人 研究 方法 ， 即 


Q) 图 片 来 源 : Wikipedia。 


给 出 所 谓 的 智能 程序 一 个 数学 上 的 定义 ， 然 后 运用 严格 的 数理 逻辑 讨论 它 的 性 质 。 但 
是 ,理论 上 已 证 明 , 明 特定 义 的 乔 能 程序 是 数 竺 上 可 构造 的 , 但 却 是 计算 机 不 可 计算 
的 一 一 任何 计算 机 都 无 法 模拟 这 样 的 乔 能 程序 一 一 只 有 上 第 能 计算 出 来 。 

不 可 计算 的 智能 程序 有 什么 用 ? 相信 读者 会 有 这 样 的 疑问 。 实 际 上 ， 如 采 在 20 
世纪 30 年 代 ， 我们 也 会 对 图 灵 的 人 研究 发 出 同样 的 疑问 。 因 为 那个 时 候 计 算 机 还 没有 
发 明 呢 ， 那么 图 灵机 模型 有 什么 用 呢 ?” 这 也 念佛 是 传说 中 天 国 女王 对 法 拉 第 的 请 难 : 
“你 研究 的 这 些 电 磁 理 论 有 什么 用 呢 ?”” 法 拉 第 则 反问 道 :“ 那 么 , 我 导 僻 的 女王 降下 ， 
您 认为 ,您 怀 中 抱 着 的 遇 儿 有 什么 用 呢 ?” 

明 特 的 理论 虽然 还 不 能 与 图 灵 的 研究 相 比 , 但 是 , 它 至 少 为 统一 人 工 知 能 开辟 了 
新 方向 ， 让 我 们 看 到 了 统一 的 曙光。 我 们 只 有 等 得 历史 来 揭晓 最 终 的 答案 。 更 多 关于 
通用 人 工 智 能 的 内 容 ， 请 参见 本 书 第 5 章 。 


梦 栈 何 万 “(2010 至今 ) 


就 这 样 ， 在 争论 声 中 ， 人 工 智能 走 进 了 21 世纪 的 第 二 个 十 年 ， 似 乎 一 切 都 没有 
改变 。 但是, 几 件 事情 悄悄 地 发 生 了 ,它们 重新 燃 起 人们 对 于 人 工 贸 能 之 梦 的 淘 望 。 


深度 学 习 


21 世纪 的 第 二 个 十 年 , 如 果 要 评选 出 最 艺人 注目 的 人 工 乔 能 研究, 那么 一 定 要 数 
深度 学 习 〈Deep Learning ) 了 。 


2011 年 ,谷歌 和 实验 室 的 研究 人 员 从 YouTube 视频 中 抽取 出 1000 万 张 静 态 图 片 ， 
把 它 咀 给 “谷歌 大 脑 ”一 一 一 个 采用 了 所 谓 深度 学 习 技术 的 大 型 神经 网 络 模型 ， 在 这 
些 图 片 中 寻找 重复 出 现 的 模式 。 三 天 后 ， 这 人 台 超 级 “大 脑 ” 在 没有 人 类 的 帮助 下 ， 届 
然 上 自己 从 这 些 图 片 中 发 现 了 “ 猫 ”。 

2012 年 11 月 ,微软 在 中 国 的 一 次 活动 中 ， 展 示 了 他 们 新 研制 的 一 个 全 目 动 的 同 
声 翻译 系统 一 一 采用 了 深度 学 习 技 术 的 计算 系统 。 演 讲 者 用 英文 演讲 ， 这 人 台 机 天 能 
实时 地 完成 语音 识别 、 机 器 翻译 和 中 文 的 语音 合成 ， 也 就 是 利用 深度 学 习 完成 了 同 
声 传译 。 

2013 年 1 月, 百度 公司 成 立 了 百度 研究 院 ， 其 中 ,深度 学 习 人 研究 所 是 该 研究 院 弃 
下 的 第 一 个 研究 所 。 
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这 些 全 球 项 尖 的 计算 机 、 互 联网 公司 都 不 约 而 同 地 对 深度 学 习 表现 出 了 极 大 的 兴 
趣 。 那 么 完 竟 什么 是 深度 学 习 呢 ? 

事实 上 ， 深 度 学 习 仍然 是 一 种 神经 网 络 模型 ， 只 不 过 这 种 神经 网 络 具备 了 更 多 层 
次 的 隐 含 层 节点 ， 同 时 配备 了 更 先进 的 学 习 技术 ， 如 图 1-13 所 示 。 


卷 积 


L0 (输入 ) EA EL2 
512x512 256x256 128x128 64x64 32x32 (输出 ) 


图 1-13 一 个 深度 神经 网 络 模型 


然而 ， 当 我 们 将 超大 规模 的 训练 数据 喂 给 这 度 学 习 模 型 的 时 候 , 这 些 具备 深层 次 
结构 的 神经 网 络 仿佛 播 吴 一 变 ， 成 为 了 拥有 感知 和 学 习 能 力 的 大 脑 ， 表 现 出 了 远 远 好 
于 传统 神经 网 络 的 学 习 和 泛 化 的 能 


当 我 们 追溯 历史 ， 次 度 学 习 神 经 网 络 其 实 早 在 20 世纪 80 年 代 就 出 现 了 。 然 而 ， 
当时 的 深度 网 络 并 没有 表现 出 任何 超凡 能 力 。 这 是 因为 ， 当 时 的 数据 资源 远 没 有 现在 
丰富 ， 而 深度 学 习 网 络 恰恰 需要 大 量 的 数据 以 提高 它 的 训练 实例 数量 。 

到 了 2000 年 ， 当 大 多 数 科 学 家 已 经 对 深度 学 习 失 去 兴趣 的 时 候 ， 又 是 那个 杰 
夫 “' 注 顿 带领 他 的 学 生 继 续 在 这 个 冷门 的 领域 里 坚持 耕耘 。 起 初 他 们 的 研究 并 不 顺 
利 ， 但 他 们 坚信 他 们 的 算法 必 将 给 世界 种 来 惊奇 。 


惊奇 终于 出 现 了 ， 到 了 2009 年 ， 辛 顿 小 组 获得 了 意外 的 成 功 。 他 们 的 深度 学 习 
神经 网 络 在 语音 识别 应 用 中 取得 了 重大 的 突破 ,转换 精度 已 经 突破 了 世界 纪录 ,错误 
率 比 以 前 减少 了 25%。 可 以 说 ， 辛 顿 小 组 的 研究 让 语音 识别 领域 缩短 了 至 少 10 年 的 
时 间 。 就 这 样 ， 他 们 的 突破 吸引 了 各 大 公司 的 注意 。 蕴 果 公司 甚至 把 他 们 的 研究 成 果 
应 用 到 了 Siri 语音 识别 系统 上 ， 使 得 iPhone 5 全 球 热卖 。 从 此 ， 深 度 学 习 的 流行 便 一 
发 不 可 收拾 。 


那么 ,为 什么 把 网 络 的 深度 提高 ,配合 上 大 数据 的 训练 就 能 使 得 网 络 性 能 有 如 此 
大 的 改善 呢 ? 答案 是 ， 因 为 人 脑 恰恰 就 是 这 样 一 种 多 层次 的 猴 度 神经 网 络 。 例 如 ,已 
有 的 证 据 表 明 ， 人 脑 处 理 视 觉 信息 就 是 经 过 多 层 加 工 完成 的 。 所 以 ， 这 度 学 习 实 际 上 
只 不 过 是 对 大 脑 的 一 种 模拟 。 

模式 识别 问题 长 久 以 来 是 人 工 和 食 能 发 展 的 一 个 主要 瓶 贷 。 然 而 ,深度 学 习 技术 似 
乎 已 经 突破 了 这 个 瓶 殊 。 有 人 甚至 认为 ,次 度 学 习 神 经 网 络 已 经 可 以 达到 2 岁 小 孩 的 
识别 能 力 。 有 理由 相信 ， 深 度 学 习 会 将 人 工 乔 能 引入 全 新 的 发 展 局 面 。 本 书 第 6 章 将 
详细 介绍 深度 学 习 这 一 全 新 拉 术 ,第 14 章 将 介绍 集 知 俱乐部 下 的 一 个 研究 小 组 对 深 
度 学 习 技 术 的 应 用 一 一 彩云 天 气 ， 用 人 工 智能 提供 精准 的 短 时 间 天 气 预报 。 


模拟 大 脑 

我 们 已 经 看 到 , 深度 学 习 模 型 成 功 的 秘诀 之 一 就 在 于 它 模仿 了 人 类 大 脑 的 深层 体系 
结构 。 那么 , 我 们 为 什么 不 耳 接 模拟 人 类 的 大 脑 呢 ?事实 上 , 科学 家 们 已 经 行动 起 来 了 。 

例如 ,德国 海德 尔 堡 大 学 的 FACETS ( Fast Analog Computing with Emergent 
Transient States ) 计划 就 是 一 个 利用 便 件 来 模拟 大 脑 部 分 功能 的 项 目 。 他 们 采用 数 以 
千 计 的 芯片 ， 创 造 出 一 个 包含 10 亿 神 经 元 和 10” 突 触 的 回路 的 人 工 脑 ( 其 复杂 程度 
相当 于 人 类 大 脑 的 十 分 之 一 )。 与 此 对 应 ， 由 瑞士 洛桑 理工 学 院 和 IBM 公司 联合 发 起 
的 蓝 色 大 脑 计划 则 是 通过 软件 来 模拟 人 脑 的 实践 。 他们 采用 逆 癌 工程 方法 , 计划 2015 
年 开发 出 一 个 虚拟 的 大 脑 。 


然而 ， 这 类 人 研究 计划 也 有 很 大 的 局 限 性 。 其 中 最 大 的 问题 就 在 于 : 迄今 为 止 ,我 
们 对 大 脑 的 结构 以 及 动力 学 的 认识 还 相当 初级 , 尤其 是 神经 元 活动 与 生物 体 行为 之 间 
的 关系 还 远 远 没有 建立 。 例 如 ， 尺 管 科学 家 早 在 30 年 前 就 已 经 弄 清楚 了 秀丽 隐 杆 线 
虫 ( Caenorhabditis elegans ) 302 个 神经 元 之 则 的 连接 方式 ,但 到 现在 仍然 不 清楚 这 种 
低 等 生物 的 生存 行为 (例如 进食 和 交配 ) 是 如 何 产生 的 。 尽 管 科学 家 已 经 做 过 诸多 洋 
试 ， 比 如 连接 组 学 ( Connectomics )， 也 就 是 全 面 监 测 神 经 元 之 间 的 联系 ( 即 突 触 ) 的 
学 问 ， 但是， 正如 线虫 研究 一 样 ， 这 幅 图 谱 仪 仪 是 个 开始 ， 它 还 不 足以 解释 不 断 变 化 
的 电信 号 是 如 何 产生 特定 认 知 过 程 的 。 

于 是 , 为 了 进一步 深入 了 解 大脑 的 运行 机 制 ,一些 “大 科学 ”项目 先 后 启动 。 2013 
年 ， 美 国 奥巴马 政府 宣布 了 “ 脑 计 划 ”( Brain Research through Advancing Innovative 
Neurotechnologies , 简称 BRAIN ) 的 启动 ,该 计划 在 2014 年 的 启动 资金 为 1 亿 多 美元 ， 
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致力 于 开发 能 记录 大 和 群 神经 元 甚至 是 整 族 脑 区 电 活动 的 新 技术 。 


无 独 有 偶 ， 欧盟 也 发 起 了 “人 类 大 脑 计划 ”( The Human Brain Project )， 这 一 计划 
为 期 10 年 , 将 耗资 16 亿美 元 , 致力 于 构建 能 真正 模拟 人 脑 的 超级 计算 机 。 除 此 之 外 ， 
中 国 、 日 本 、 以 色 列 也 都 有 雄心 勃勃 的 脑 科 学 研究 计划 出 炉 。 这 似乎 让 人 们 想到 了 第 
二 次 世界 大 战 后 的 情景 ， 各 国 争 相 发 展 “ 大 科学 项 目 ": 核武 器 、 太 空 探 索 、 计 算 机 
等 。 脑 科学 的 时 代 已 经 来 临 。 关 于 人 脑 与 电脑 的 比较 ， 请 参见 本 书 第 7 章 。 


“人工” 人 工 乱 能 


2007 年 , 一 位 谷歌 的 实习 生路 易 斯 : 汉 … 安 (LuisvonAhn ) 
开发 了 一 蒜 有 趣 的 程序 “ReCapture”， 却 无 意 间 开 创 了 一 个 新 
的 人 工 智能 研究 方向: 人 类 计算 。 


ReCapture 的 初衷 很 商 单 , 它 和 希望 利用 人 类 高 超 的 模式 识别 
能 力 ， 目 动 帮 助 谷歌 公司 完成 大 量 扫 摘 图 书 的 文宣 识别 任务 。 
但 是 , 如 果 要 雇用 人 力 来 完成 这 个 任务 则 需要 花费 一 大 笔 开 销 。 
于 是 ， 冯 ，… 安 想到 ， 每 天 都 有 大 量 的 用 户 在 输入 验证 人 码 来 回 机 
璐 证 明 目 己 是 人 而 不 是 机 带 ， 而 输入 验证 但 事实 上 就 是 在 完成 文本 识别 问题 。 于 是 ， 
一 方面 是 有 大 量 的 扫描 的 图 书 中 难以 识别 的 文学 需要 人 来 识别 ; 为 一 方面 是 由 计算 机 
生成 一 些 扭曲 的 图 片 让 大 量 的 用 户 做 识别 以 表明 目 己 的 映 份 。 那么 , 为 什么 不 把 两 个 
方面 结合 在 一 起 呢 ? 这 就 是 ReCapture 的 创意 (如 图 1-14 所 示 )， 汉 安 聪 明 地 让 用 
户 在 输入 识别 码 的 时 候 悄 悄 帮助 谷歌 完成 了 文字 识别 工作 |! 


reCAPTCHA IS A FREE 
ANTIBOT SERVICE THAT 
HELPS DIGITIZE BOOKS. 


1-14 人 类 计算 系统 ReCapture 


这 一 成 功 的 应 用 实际 上 是 借助 人 力 完 成 了 传统 的 人 工 智能 问题 , 冯 … 安 把 它 叫 作 
人 类 计算 ( Human Computation )， 我 们 则 把 它 形 象 地 称 为 “人 工 ” 人 工 智能 。 除 了 
ReCapture 以 外 ， 汉 安 还 开发 了 很 多 类 似 的 程序 或 系统 ， 例 如 ESP 游戏 是 让 用 户 通 
过 竞争 的 方式 为 图 片 贴标签 ， 从 而 完成 “人 工 ” 人 工分 类 图 片 ; Duolingo 系统 则 是 让 
用 户 在 学 习 外 霹 的 同时 ， 顺 便 翻 谋 一 下 互联 网 ， 这 是 “人 工 ” 机 硕 翻 译 。 


也 许 , 这 样 巧 妙 的 人 机 结合 才 是 人 工 贸 能 发 展 的 新 方 巾 之 一 。 因 为 一 个 完全 脱离 
人 类 的 人 工 知 能 程序 对 于 我 们 没有 任何 独立 存在 的 意义 , 所 以 人 工 智 能 必然 会 面临 人 
机 交互 的 问题 。 而 随 看 互联 网 的 兴起 ， 人 和 计算 机 交互 的 方式 会 更 加 便捷 而 多 样 化 。 
因此 ， 这 为 传统 的 人 工 稼 能 问题 提供 了 全 新 的 解决 途径 。 


然而 ,读者 也 许 会 质疑 ， 这 种 摊 合 7 人 类 智能 的 系统 还 能 叫 作 纯粹 的 人 工 智 能 
吗 ? 这 种 质疑 事实 上 有 一 个 隧 含 的 前 提 ， 就 是 人 工 贸 能 是 一 个 独立 运作 的 系统 ， 它 与 
人 类 环境 应 相互 隔离 。 但 当 我 们 考虑 人 关 智 能 的 时 候 就 会 发 现 ,任何 智能 系统 都 不 能 
与 环境 绝对 隔离 ， 它 只 有 在 开放 的 环境 下 才能 表现 出 智能 。 同 样 的 道理 ， 人 工 智能 也 
必须 向 人 类 开放 ， 于 是 引入 人 的 作用 也 变 成 了 一 种 很 目 然 的 事情 。 关 于 这 个 主题 ,我 
们 将 在 本 书 第 8 章 和 第 9 章 中 进一步 讨论 。 


士 、 五 
2 省 


本 章 介 绍 了 人 工 智能 近 60 年 所 走 过 的 曲折 道路 。 也 许 ， 谈 者 所 期 竺 的 内 容 ， 诸 
如 奇 点 临近 、 超 级 乔 能 机 亿 人 、 人 与 机 各 的 共生 演化 等 激动 人 心 的 内 容 并 没有 出 现 ， 
但 是 ， 我 能 保证 的 ， 是 一 段 真实 的 历史 ， 并 力图 做 到 准确 无 误 。 

不 


尽管 人 工 稼 能 这 条 道路 虹 昨 曲折 , 草 环 密布 ， 但 至 少 它 在 发 展 并 不 断 壮 大 。 最 重 
要 的 是 ， 人 们 对 于 人 工 冯 能 的 梦想 永远 没有 破灭 过 。 也 许 人 工 镶 能 之 梦 将 无 法 在 你 我 
的 有 生 之 年 实现 ,也 许 人 工 入 能 之 梦 始终 无 法 逾越 哥 德 尔 定理 那个 硕大 无 朋 的 “如 来 
佛手 营 ”， 但 是 ， 人 工 智能 之 梦 将 永远 驱动 春 我 们 不 断 前 行 ， 挑 战 极 限 。 


天 于 布尔 们 特 、 图 灵 、 哥 德尔 的 故事 和 相关 人 研究 可 以 阅 谈 《 哥 德 尔 、 艾 舍 尔 、 
巴赫 : 集 异 壁 之 大 成 一 书 。 关 于 冯 : 诺 依 坚 ， 可 以 阅读 他 的 传记 :《 天 才 的 拓 充 者 : 
冯 ， 库 依 受 传记 关于 维 纳 ， 可 以 参考 他 的 若 作 《控制 论 六 奉 要 全 面 了 解 人 工 智能 ， 


30 ， 科 学 的 极致 :漫谈 人 工 智 能 


给 大 家 推荐 两 本 书 : Artificial Intelligence: 4 Modern Approach 和 Artificial Intelligence: 
Structures and Strategies for Complex Problem Somig。 了 解 机 融和 学 习 以 及 人 工 神经 网 络 
可 以 参考 Pattern Recognition 和 Neural Networks and Learnine Machines。 关 于 行为 学 
派 和 人 工 生命 , 可 以 参考 《数字 创世纪 : 人 工 生命 的 新 科学 》 以 及 人 工 生 命 的 论文 集 。 
和 奇 要 深入 了 解 风 叶 斯 网 络 , 可 以 参考 Causality: Models, Reasoning, and Inference。 深入 
了 解 衣 特 的 通用 人 工 智能 理论 可 以 阅读 Universal Artificial Intelligence: Sequential 
Decisions Based on Algorithmic Probability。 关 于 深度 学 习 方 面 的 知识 可 参考 网 站 : 
http://deeplearning.net/reading-list/， 其 中 有 不 少 综述 性 的 文 草 。 人 类 计算 方面 可 以 参考 
冯 ，… 安 的 网 站 : http:/www.cs.cmu.edu/~biglou/。 
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图 灵机 ( Turing Machine ) 与 计算 理论 (Theory of Computation ) 是 人 工 智 能 乃至 
整个 计算 机 科学 的 理论 基础 。 邢 奇 - 图 灵 论 题 ( Church-Turing Thesis ) 告诉 我 们 ， 一 
切 可 计算 过 程 都 可 以 用 图 灵机 模拟 。 因 此 ， 无 论 如 何人 工 智 能 都 无 法 逃脱 图 灵机 可 计 
算 理 论 的 邦 畴 。 本 章 从 图 灵 可 计算 理论 的 基础 出 发 ,忽略 挥 一 切实 用 的 工程 细 方 ， 来 
讨论 计算 机 可 以 做 和 不 可 以 做 的 事情 。 从 这 些 讨论 中 ,我 们 可 以 站 在 一 定 的 理论 高 度 
来 笑 探 人 工 智 能 的 前 进 方 癌 。 


本 章 首 先 会 引入 网 灵机 模型 ， 为 了 让 该 者 对 这 个 概念 有 比较 直观 的 理解 ， 我 采用 
了 一 个 人 工 生 命 “ 小 虫 ” 的 比喻 来 叙述 。 接 下 来 会 介绍 跟 图 灵机 有 关 的 概念 ， 例 如 什 
么 是 模拟 ， 什 么 是 “万 能 计算 ”( 即 通 用 计算 ，universal computation ) 等 。 最 后 是 关 
于 图 灵 停 机 问题 的 探讨 , 我 个 人 认为 很 有 可 能 未 来 对 人 工 智能 的 重大 突破 都 来 源 于 对 
图 灵 停 机 问题 的 深入 理解 。 男 外 ,我 除了 用 自己 的 方式 介绍 一 些 现 有 的 基本 概念 之 外 
(为 了 尽量 表达 得 清楚 明白 ,我 不 得 不 放弃 理论 论证 的 严格 性 )， 还 探讨 了 很 多 我 认为 
很 有 价值 而 计算 理论 却 没 有 涉及 的 问题 。 在 这 部 分 内 容 上 我 都 标 上 了 * 号 ， 我 尝试 着 
给 出 了 自己 的 思考 结果 ， 而 没有 经 过 严格 的 理论 推 谢 , 希望 读者 能 有 选择 地 看 待 这 些 
问题 和 观点 。 


到 灵机 


计算 是 一 个 司空 匈 惯 、 训 已 有 之 的 概念 。 例 如 ,我国 证 代 发 明 的 算盘 就 是 一 种 计 
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算 的 机 希 。 然 而 ， 现 代 科 学 的 计算 概念 则 要 追溯 到 20 世纪 初 希 尔 伯 特 给 国际 数学 界 
留 下 的 著名 的 硕 尔 伯 特 第 十 问题 :“ 是 否 存 在 着 判定 任意 一 个 丢 炙 图 方程 有 解 的 机 械 
化 运算 过 程 。” 很 多 数学 家 如 库 尔 特 ' 哥 德 尔 ( Kurt Godel )、 阿 隆 优 到 奇 (Alonzo 
Church )、 斯 带 苍 ， 克 莱 尼 ( Stephen Kleene ) 等 人 都 给 出 了 各 目的 解答 。 然 而 ， 这 些 
解答 都 很 抽象 或 烦琐， 只 有 网 灵 给 出 的 解答 一 一 图 灵机 模型 既 二 观 又 简洁 ， 因 此 人 们 
普遍 接受 了 图 灵机 模型 作为 计算 理论 的 标准 模型 。 

下 面 ,我 们 开始 介绍 图 灵机 模型 。 我 先 把 这 个 概念 抛 给 你 ,虽然 有 些 无 趣 ， 不 过 
请 坚持 看 下 去 ,后面 我 会 重新 解释 的 。 在 这 里 你 只 需要 认识 它 的 轮廓 。 图 灵机 是 如 图 
2-1 所 示 的 一 个 闭 置 。 


2-1 图 灵机 


这 个 装置 由 下 面 几 个 部 分 组 成 : 一 条 无 限 长 的 纸 带 ; 一 个 读 写 涉 ( 中间 那个 大 盒 
子 ); 内 部 状态 (盒子 上 的 方块 ， 比 如 A、B、D、E ); 还 有 一 个 程序 对 这 个 盒子 进行 
控制 。 这 个 装置 就 是 根据 程序 的 命令 及 其 内 部 状态 进行 磁 珊 的 读 写 和 移动 。 


它 工 作 的 时 候 是 这 样 的 : 从 谈 写 头 在 纸 市 上 该 出 一 个 方 格 的 信息 ,并 且 根 据 它 当 
前 的 内 部 状态 开始 在 程序 表 中 碍 找 对 应 的 指令 ， 然 后 得 出 一 个 输出 动作 ， 也 就 是 往 纸 
市 上 写 信 息 ， 还 是 移动 谈 写 头 到 下 一 个 方 格 。 程 序 也 会 告诉 它 下 一 时 刻 内 部 状态 转移 
到 哪 一 个 。 
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具体 的 程序 束 是 一 个 列表 ， 也 叫 作 规则 表 或 指令 表 ， 如 表 2-1 所 示 。 


表 2-1 规则 表 


当前 内 部 状态 (s) 输入 数值 (7) 输出 动作 (0) 下 一 时 刻 的 内 部 状态 (s” 
B ] 前 移 C 
A 0 往 纸 市 上 号 1 B 
C 0 后 移 A 


因此 ， 图 灵机 只 要 根据 每 一 时 刻 读 写 头 读 到 的 信息 和 当前 的 内 部 状态 进行 查 表 ， 
就 可 以 确定 它 下 一 时 刻 的 内 部 状态 和 输出 动作 本 。 


图 灵机 就 是 这 么 简单 ! 不 可 思议 吧 ? 而 只 要 你 修改 它 的 程序 (也 就 是 上 面 的 规则 
表 )， 它 就 可 以 为 你 做 计算 机 能 够 完成 的 任何 工作 。 因 此 可 以 说 ， 图 灵机 就 是 一 个 最 
简单 的 计算 机 模型 ! 


也 许 ， 你 会 党 得 图 灵机 模型 太 人 简单 ， 怎 么 可 能 完成 计算 机 的 复杂 任务 呢 ? 问题 的 
关键 是 如 何 理解 这 个 模型 。 


如 何 理解 图 灵机 


我 们 不 妨 考虑 这 样 一 个 问题 。 假 设 一 只 小 虫 在 地 上 疏 , 那么 我 们 应 该 怎样 从 信息 
处 理 的 角度 来 建立 一 个 小 虫 的 模型 呢 ? 


首 完 , 我 们 需要 对 小 虫 所 在 的 环境 进行 建 模 。 我 们 不 妨 假设 小 虫 所 处 的 世界 是 一 
个 无 限 长 的 纸 市 , 这 个 纸 惠 被 分 成 了 右 干 小 方 格 , 而 每 个 方 格 都 只 有 美和 日 两 种 颜色 。 
很 显然 ， 这 个 小 虫 要 有 了 眼睛 、 曙 子 或 者 耳 和 等 感觉 硕 官 来 获得 外 部 世界 的 信息 。 我 们 
不 妨 把 模型 商 化 ,假设 它 仅仅 具有 一 个 感觉 俘 官 : 眼睛 ， 而 且 它 的 视力 弱 得 可 怜 ， 也 
就 是 说 ， 它 仅仅 能 够 感知 到 它 所 处 的 方 格 的 闫 色 ， 因 此 这 个 方 格 所 在 位 置 的 黑色 或 者 
日 色 的 信息 就 是 小 中 的 输入 信息 。 小 虫 模 型 如 网 2-2 所 示 。 


2-2 ”小 虫 模型 
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妨 外 , 我们 当然 还 需要 让 小 虫 能 够 动 起 来 。 我 们 仍然 考虑 最 简单 的 情况 : 小 虫 的 
输出 动作 就 是 在 纸 市 上 前 进 一 个 方 格 或 者 后 退 一 个 方 格 。 


仅仅 有 了 输入 装置 和 输出 竣 置 ， 小 虫 还 不 能 动 起 来 ， 原 因 很 催 单 ， 它 并 不 知道 该 
怎样 在 各 种 情况 下 选择 它 的 输出 动作 。 于 是 我 们 就 需要 给 它 指定 行动 的 规则 ， 这 就 是 
程序 。 假 设 我 们 记 小 虫 的 输入 信息 集合 为 天 { 轩 色 ,， 日 色 }, 它 的 输出 可 能 行动 的 集合 
是 0={ 前 移 ， 后 移 }， 那 么 程序 就 要 告诉 它 在 给 定 了 输入 ( 比如 黑色 ) 的 情况 下 ， 它 
应 该 选择 什么 输出 。 因 而 ,一 个 程序 束 是 一 个 从 I 集合 到 O 集合 的 映射 。 我 们 也 可 以 
用 列表 的 方式 来 表示 程序 ， 如 表 2-2 所 不 。 

表 2-2 一 个 程序 


输入 输出 
加 前 移 
日 后 移 


这 个 程序 非常 简单 ， 它 告诉 小 虫 当 读 到 一 个 黑色 方 格 的 时 候 就 往 前 走 一 个 方 格 ， 
当 读 到 一 个 日 色 方 格 的 时 候 束 后 退 一 个 方 格 。 


我 们 不 妨 假设 ,小 虫 所 处 的 世界 的 一 个 片段 是 : 尘 淡 黑 日 日 黑 日 …… (如 图 2-3 
所 示 )， 小 虫 从 堪 站 开始 。 


2-3 ”小 虫 世 磺 的 一 个 片段 


那么 小 虫 读 到 这 个 片段 会 怎样 行动 呢 ?” 它 和 完 读 到 漂 色 , 然后 根据 程序 前 移 一 个 方 
格 ， 于 是 就 会 得 到 为 外 一 个 黑色 信息 ， 这 个 时 候 它 会 根据 程序 再 次 前 移 一 个 方 格 ，, 仍 
然 是 黑色 ,再 前 移 。 这 个 时 候 就 读 到 日 色 方 格 了 , 根据 程序 ， 它 应 该 后 退 一 个 格 ， 这 个 
时 候 就 是 黑色 了 。 前 移 ， 日 色 ， 后 移 ， 黑 色 ，…… 可 以 预见 小 虫 会 无 限 地 循环 下 去 。 


然而 ,现实 世界 中 的 小 虫 肯 定 不 会 傻 俊 地 在 那里 无 限 循 环 下 去 。 我 们 还 需要 改进 
这 个 最 简单 的 模型 。 首 匈 ， 小 忠 除了 可 以 机 械 地 在 世界 上 移动 以 外 ， 还 会 对 世界 本 号 
造成 影响 ， 因 而 改变 这 个 世界 。 比 如 小 虫 看 到 劳 边 有 食物 ， 就 会 把 食物 吃 掉 。 在 我 们 
这 个 模型 中 ,也 就 相当 于 必须 假设 小 虫 可 以 改 号 纸 市 上 的 信息 。 因 而 ,小 忠 可 能 的 输 
出 动作 集合 就 变 成 了 了 0O={ 前 移 ， 后 移 ， 涂 墨 ， 涂 日 }。 这 个 时 候 ， 我 们 可 以 修改 之 前 
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的 程序 ， 如 表 2-3 所 示 。 
表 2-3 ”修改 后 的 程序 


输入 输出 
由 前 移 
日 涂 黑 


纸 市 是 墨 墨 日 日 黑 ……， 小 虫 会 怎样 行动 呢 ?” 图 2-4 到 图 2-10 分别 表 示 出 了 这 
Os 


第 一 步 : 小 虫 在 最 左边 的 方 格 ， 根 据 程序 的 第 一 行 ， 读 人 黑色 应 该 前 移 。 


图 2-4 第 一 步 


第 二 步 : 仍然 谈 和 黑色， 根据 程序 的 第 一 行 ， 前 移 。 


图 2-5 第 二 步 


三 步 : 这 个 时 候 谈 入 的 是 日 色 ， 根 据 程 序 的 第 二 行 ， 应 该 把 这 个 方 格 涂 黑 ， 而 


没有 其 他 的 动作 .假设 这 张 图 上 的 方 格 仍然 没有 涂 黑 , 而 在 下 一 时 刻 才 把 它 表示 出 来 


图 2-6 第 三 步 


第 四 步 : 当前 方 格 已 经 是 黑色 的 ， 因 此 小 虫 谈 和 人 黑色 方 格 ， 前 移 。 


图 2-7 第 四 步 


第 五 步 : 读 入 日 色 ， 浴 志方 格 ， 原 地 不 动 。 
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图 2-8 第 五 步 


第 六 步 : 当前 的 方 格 已 经 被 涂 墨 ， 继 续 前 移 。 


图 2-9 第 六 步 


第 七 步 : 该 和 人 黑色 ， 前 移 。 


图 2-10 ”第 七 步 


小 虫 的 动作 还 会 持续 下 去 , 我 们 看 到 , 小 虫 将 会 不 保 地 重复 上 面 的 动作 不 断 前 移 ， 
并 会 把 所 有 的 纸 带 涂 黑 。 


显然 ， 你 还 可 以 设计 出 其 他 的 程序 来 ,然而 无 论 你 的 程序 怎么 复杂 ， 无论 纸 市 子 
的 情况 如 何 , 小 中 的 行为 都 会 要 么 停留 在 一 个 方 格 上 , 要 么 蝴 一 个 方 回 永远 运动 下 去 ， 
有 要么 就 是 在 几 个 方 格 上 来 回 打 转 。 然 而 , 无 论 皇 样 , 小 虫 比 起 真实 世界 中 的 虫子 来 次 ， 
有 一 个 致命 的 弱点 : 那 就 是 如 果 你 给 它 固定 的 输入 信息 , 它 就 会 给 你 固定 的 输出 信息 ! 
因为 程序 是 固定 的 ， 每 当 黑 色 信 息 输入 的 时 候 ， 无 论 如 何 小 虫 都 仅仅 前 移 一 个 方 格 ， 
而 不 会 做 出 其 他 的 反应 。 它 似乎 真 的 是 机 械 的 ! 


如 果 我 们 进一步 更 改 小 虫 模型 ， 那么 它 就 会 有 所 改进 ， 至少 在 给 定 相 同 输入 的 情 
况 下 ， 小 虫 会 有 不 同 的 输出 情况 。 这 就 是 加 入 小 虫 的 内 部 状态 。 我 们 可 以 做 这 样 一 个 
比喻 : 假设 墨色 方 格 是 食物 ， 虫 子 可 以 吃 掉 它 ， 而 当 吃 到 一 个 食物 后 ， 小 虫 就 会 感觉 
到 饱 了 。 当 读 入 的 信息 是 白色 方 格 的 时 候 ， 虽 然 没 有 食物 但 它 仍然 吃 饱 了 ， 只 有 当 再 
次 读 和 人 黑色 的 时 候 它 才 会 感觉 到 自己 饥 俄 了 。 因 而 ， 我 们 说 小 虫 具有 两 个 内 部 状态 ， 
并 把 它 所 有 内 部 状态 的 集合 记 为 S={ 饥 俄 , 吃 饱 }。 这 样 小 虫 行动 的 时 候 不 仅 会 根据 它 
的 输入 信息 ， 而 且 会 根据 它 当 前 的 内 部 状态 来 决定 输出 动作 ， 并且 还 要 更 改 它 的 内 部 
状态 。 而 它 的 这 一 行动 仍然 要 用 程序 控制 ， 只 不 过 跟 上 面 的 程序 比 起 来 ， 现 在 的 程序 
就 更 复杂 一 些 了 ， 如 表 2-4 所 示 。 
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表 2-4 ”更 复杂 的 程序 


输入 当前 内 部 状态 输出 下 一 时 刻 的 内 部 状态 
江 饥 包 e 涂 日 吃 人 也 
汪 岂 饮 后 移 饥饿 
日 饥 包 V 涂 簿 饥饿 
日 岂 饮 前 移 岂 饮 


这 个 程序 复杂 多 了 ， 你 不 仅 需要 指定 每 一 种 输入 情况 下 小 虫 应 该 采取 的 动作 ， 而 
且 还 有 要 指定 在 每 种 输入 和 内 部 状态 的 组 合 情 况 下 小 虫 应 该 怎样 行动 。 看 看 我 们 的 小 虫 
在 谈 入 尘 日 日 淡 日 …… 这 样 的 纸 市 的 时 候 会 蚊 样 。 仍 然 用 一 系列 图 ( 图 2-11 到 2-18) 
来 表示 ， 灰 色 的 圆 点 表示 饥饿 的 小 虫 ， 日 色 的 圆 点 表示 它 吃 他 了 。 为 了 清晰 ， 我 们 把 
小 虫 将 要 变 成 的 状态 写 在 了 图 的 下 方 。 

假定 它 仍然 从 左 端 开 始 , 而 且 小 虫 处 于 饥饿 状态 。 这 样 谈 入 黑色 , 当前 饥 俄 状态 ， 
根据 程序 第 一 行 ， 把 方 格 涂 日 ， 并 变 成 吃 饱 ( 这 相当 于 把 食物 吃 了 ， 注 意 吃 完 后 ， 小 
虫 并 没 动 )。 


涂 日 方 格 ， 变 成 吃 饱 


图 2-11 第 一 步 


第 二 步 : 当前 的 方 格 变 成 了 日 色 ， 因 而 恋 入 日 色 ， 而 当前 的 状态 是 吃 饱 状态 ， 那 
么 根据 程序 中 的 第 四 条 应 该 前 移 ， 仍 然 处 于 吃 饱 状态 。 


前 移 ， 仍 然 吃 饱 


2-12 ”第 二 步 


第 三 步 : 该 人 日 色 ， 当 前 状态 是 吃 饱 ， 因 而 会 重复 第 二 步 的 动作 。 


[al 


| 前 移 ， 保 持 吃 饱 | 


2-13 ”第 三 步 
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第 四 步 : 仍然 重复 上 次 的 动作 。 


前 移 ， 保 持 吃 饱 


图 2-14 第 四 步 


第 五 步 : 谈 和 人 黑色 ， 当 前 状态 是 吃 饱 ， 这 时 候 根 据 程 序 的 第 二 行 应 该 后 移 方 格 ， 
并 转 人 饥 俄 状态 。 


后 移 ， 变 成 饥饿 


2-15 ”第 五 步 


第 六 步 : 读 入 日 色 ,， 当前 饥 俄 状态 , 根据 程序 第 三 行 应 该 潜 淡 ,并 保持 饥 俄 状态 。 
(注意 ， 这 只 小 虫 似乎 自己 吐出 了 食物 !) 


涂 委 ， 你 持 饥 俄 


2-16 第 六 步 


第 七 步 : 恋人 黑色， 当前 饥 俄 ， 于 是 把 方 格 涂 日 ， 并 转 入 吃 饱 状态 。( 呵呵 ， 小 
果 把 目 己 刚刚 吐出 来 的 东西 又 吃 折 了 了 1 ) 


涂 日 ， 转 入 吃 饱 


图 2-17 第 七 步 


第 八 步 : 谈 入 日 色 ， 当 前 吃 饱 ， 于 是 前 移 ， 保 持 吃 饱 状态 。 
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前 移 ， 保 持 吃 饱 


2-18 第 八 步 


这 时 候 的 情况 已 经 跟 第 四 步 的 完全 一 样 了 ， 因 而 小 虫 会 完全 重复 五 、 六 、 七 、 八 
步 的 动作 , 并 永远 循环 下 去 。 最 后 的 墨色 方 格 似乎 是 一 个 门 覃 ,小 虫 无 论 如 何 也 跨越 
不 过 去 了 。 


小 虫 的 行为 比 以 前 的 程序 复杂 了 了 一些。 尽管 从 长 期 来 看 , 它 最 后 仍然 会 落 和 机械 
的 循环 或 者 无 休止 的 重复 。 然 而 这 与 前 面 的 程序 从 本 质 上 已 经 完全 不 同 了 ， 因 为 当 你 
给 小 虫 输入 日 色 信 息 的 时 候 ， 它 的 反应 是 你 “不 能 预测 ”的 。 它 有 可 能 涂 尖 方 格 也 有 
可 能 前 移 一 个 格 。 当 然 前 提 是 你 不 能 打开 小 虫 看 到 它 的 内 部 结构 ， 也 不 能 知道 它 的 程 
序 ， 那么 你 所 看 到 的 就 是 一 个 “不 能 预测 ”的 满 地 乱 候 的 小 虫 。 如 果 小 虫 的 内 部 状态 
数 再 增多 呢 ?” 那 么 它 的 行为 会 更 加 地 “不 可 预测 ”。 


说 到 这 里 ， 你 可 能 对 于 “小 虫 的 行为 不 可 预测 ”这 和 句 话 持 反 对 意见 。 因 为 所 有 可 
能 的 输入 状态 是 固定 的 ， 所 有 的 内 部 状态 无 论 多 少 也 是 固定 的 ,那么 小 虫 所 有 可 能 的 
行为 就 应 该 是 有 限 的。 然而 ， 不 要 忘记 纸 带 的 长 度 是 无 限 的 ， 虽 然 每 个 具体 的 输入 可 
能 只 有 0 和 1 两 种 状态 ， 然 而 这 些 0 和 1 的 输入 组 合 却 是 无 限 的 。 退 一 步 说 ， 输 入 纸 
带 的 情况 是 有 限 的 (你 可 以 理解 为 01 组 合 经 过 若干 长 度 就 会 出 现 循环 ， 比 如 
011011011... )， 那 么 我 们 的 小 虫 最 终 会 不 会 必然 陷入 到 无 休止 的 循环 中 呢 ? 答案 是 肯 
定 的 ， 因 为 这 个 时 候 输入 的 组 合 数 乘 以 内 部 状态 总 数 是 一 个 有 限 的 数值 ， 因 而 小 虫 必 
然 会 在 某 时 开始 重复 。 无 论 哪 种 情况 ， 似 乎 你 都 可 以 通过 某 种 聪明 的 “数学 ”判断 小 
虫 是 否 会 循环 以 及 在 什么 时 候 循环 。 也 就 是 说 ， 通 过 你 那 聪明 的 数学 ， 只 要 看 看 小 虫 
的 程序 ， 而 不 用 执行 它 就 能 够 预言 小 虫 在 多 少 步 之 后 必然 会 “ 傻 傻 地 ”重复 以 前 的 动 
作 。 这 样 一 来 ， 那 可 真是 名 副 其 实 的 “ 雕 虫 小 技 ” 了 。 然 而 真 的 是 这 样 吗 ? 这 种 判定 
小 虫 傻 傻 循 环 的 一 般 定 理 或 程序 存在 吗 ? 这 个 问题 留待 我 们 后 面 进行 讨论 。 


好 了 ， 如 末 你 已 经 彻 确 搞 全 了 我 们 的 小 虫 是 怎么 工作 的 , 那么 你 已 经 明月 了 图 灵 
机 的 工作 原理 。 因 为 从 本 质 上 讲 ， 最 后 的 小 虫 模型 就 是 一 个 图 灵机 。 


如 何 理解 图 灵机 模型 * 
刚才 用 小 虫 说 明了 图 灵机 的 工作 原理 ,相信 你 的 第 一 个 反应 就 是 , 这 样 的 模型 太 
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简单 1! 它 根本 说 明 不 了 现实 世界 中 的 任何 问题 ! 下 面 ， 我 就 要 试图 说 服 你 ， 图 灵机 
这 个 模型 是 伟大 的 。 


站 和 完 , 我 想 说 的 是 ， 其 实 我 们 每 一 个 会 决策 、 会 思考 的 人 就 可 以 被 抽象 地 看 成 一 
台 图 灵机 。 


为 什么 可 以 做 这 种 抽象 呢 ? 首先 我 们 可 以 考虑 扩展 刚才 的 小 虫 模型 。 因 为 小 虫 模 
型 是 以 一 切 都 简化 为 前 提 的 ， 所 以 它 的 确 是 太 简 单 了 。 然 而 ， 我们 可 以 把 小 虫 的 输入 
集合 、 输 出 行动 集合 、 内 部 状态 集合 进行 扩大 ， 这 个 模型 一 下 子 就 实用 多 了 。 首先 ， 
小 虫 完全 可 以 处 于 一 个 三 维 空间 中 , 而 不 是 简 简单 单 的 纸 带 上 ; 其 次 小 虫 的 视力 很 好 ， 
它 一 下 子 能 读 到 方圆 500 米 的 信息 。 当 然 , 小 虫 也 可 以 拥有 其 他 感觉 器 官 ， 比 如 嗅觉 、 
听觉 等 ， 而 这 些 改 变 都 仅仅 是 扩大 了 输入 集合 的 维 数 和 范围 ， 并 没有 其 他 更 本 质 的 改 
变 。 同 样 的 道理 ， 小 虫 可 能 的 输出 集合 也 异常 地 丰富 ， 它 不 仅 可 以 移动 自己 ,而且 可 
以 尽情 地 改造 它 所 在 的 自然 界 。 进 一 步 地 ， 小 虫 的 内 部 状态 可 能 非常 多 ,而 且 控 制 它 
的 行为 的 程序 可 能 异常 复杂 ,那么 小 虫 会 有 什么 本 事 呢 ? 这 就 很 难说 了 ， 因 为 随 着 小 
虫 内 部 状态 数 的 增加 ， 随 着 它 所 处 环境 的 复杂 度 的 增加 , 我 们 正在 逐渐 失去 对 小 虫 行 
为 的 预测 能 力 , 但 是 所 有 这 些 改 变 仍然 没有 逃 出 图 灵机 的 模型 : 输入 集合 、 输 出 集合 、 
内 部 状态 、 固 定 的 程序 。 就 是 这 四 样 东西 抓 住 了 小 忠信 息 处 理 的 根本 。 


那么 我 们 人 能 不 能 也 被 这 样 抽象 呢 ?” 显 然 , 输入 状态 集合 就 是 你 所 处 的 环境 中 能 
够 看 到 、 听 到 、 闻 到 、 感 觉 到 的 所 有 的 一 切 , 可 能 的 输出 集合 就 是 你 的 每 一 言 每 一 行 ， 
以 及 你 能 够 表达 出 来 的 所 有 表情 动作 。 内 部 状态 集合 则 要 复杂 得 多 。 因 为 我 们 可 以 把 
任意 一 个 神经 细胞 的 状态 组 合 看 作 一 个 内 部 状态 , 那么 所 有 可 能 的 神经 细胞 的 状态 组 
合 将 是 天 文 数 字 ! 

似乎 你 会 说 ， 这 个 模型 根本 不 对 ， 还 有 很 多 思维 本 质 的 东西 没有 概括 进去 ， 比 如 
记忆 问题 。 人 有 记忆 ， 图 灵机 有 人 么 ”其 实 ， 只 要 图 灵机 具有 了 内 部 状态 ， 它 就 相应 地 
具有 了 记忆 。 比 如 上 面 讲 到 的 具有 饥 俄 和 吃 饱 两 种 状态 的 小 虫 ， 就 会 记 住 它 所 经 历 过 
的 世界 : 如 果 吃 到 食物 , 就 用 吃 饱 状态 来 “ 记 住 ” 吃 过 了 食物 这 件 事 。 什么 是 记忆 呢 ? 
假如 你 经 历 了 一 件 事 情 并 记 住 了 它 , 那么 只 要 你 下 一 次 的 行动 在 相同 条 件 下 和 你 记 住 
这 件 事 情 之 前 的 行动 不 一 样 了 ， 就 说 明 该 事情 对 你 造成 了 影响 ， 也 就 说 明 你 确实 记 住 
je 

学 习 的 问题 反映 在 模型 中 了 吗 ? 学 习 是 怎么 回 事 儿 呢 ? 似乎 在 图 灵机 模型 中 不 
包括 和 学习， 因为 学 习 就 意味 春 对 程序 的 改变 ， 而 图 灵机 是 不 能 在 运行 过 程 中 改变 它 的 
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程序 的 。 然 而 ， 我 们 不 难 假设 ,你 实际 上 并 不 能 打开 一 个 人 的 脑袋 来 看 ， 所 以 它 的 实 
际 程序 规则 你 是 不 知道 的 。 很 有 可 能 一 个 图 灵机 的 规则 没有 改变 ， 只 不 过 激活 了 人 它 的 
某 些 内 部 状态 ， 因 而 它 的 行为 发 生 了 本 质 的 变化 ,尽管 给 它 相 同 的 输入 ， 它 却 给 出 了 
完全 不 同 的 输出 ， 因 而 在 我 们 看 来 ， 它 似乎 会 学 习 了 。 而 实际 上 ， 这 个 图 灵机 的 程序 
一 点 都 没 变 。 


还 有 很 多 现象 似乎 都 能 被 图 灵机 包括 ， 如 人 类 的 情绪 和 情感 。 你 完全 可 以 把 它 看 
作 某 种 内 部 状态 ， 因 而 处 于 心情 好 的 情绪 下 ， 你 的 输入 输出 是 一 侠 规 则 ， 而 心情 不 好 
的 时 候 则 完全 是 兄 一 父 规 则 。 这 仍然 没有 逃 出 图 灵机 的 模型 范 轩 。 


接 下 来 的 问题 就 是 我 们 人 类 的 思维 究竟 是 不 是 和 图 灵机 一 样 遵循 固定 的 程序 
呢 ? 这 个 问题 初 看 似乎 是 不 可 能 的 , 因为 人 的 行为 太 不 国定 了 , 可 以 说 是 不 可 预言 的 。 
然而 我 会 争辩 道 ， 无 论 如 何 神经 元 传递 信息 、 变 化 状态 的 规律 都 是 固定 的 ， 是 可 以 被 
程序 化 的 。 那 么 脑 作为 神经 元 的 整体 ， 它 的 运作 必然 也 要 遵循 固定 的 规则 也 就 是 程序 
了 。 如 果 是 这 样 ， 正 如 图 灵 相 信 的 ， 人 脑 也 不 会 超越 图 灵机 这 个 模型 ， 所 以 ， 人 工 条 
能 也 必然 是 可 能 的 。 然 而 ， 我 认为 这 个 问题 的 答案 很 有 可 能 没有 这 么 简单 我们 将 在 
最 后 详细 讨论 这 个 问题 。 

无 论 如 何 , 我 相信 你 已 经 能 够 体会 到 了 图 灵机 模型 实际 上 是 非常 强 有 力 的 。 数 学 
家 们 早已 经 提出 了 印 奇 -图 灵 论 题 以 概括 图 灵机 的 计算 能 力 ， 任 何 可 计算 过 程 都 可 以 
用 图 灵机 来 模拟 。 这 是 一 个 论题 而 非 定理 ， 因 为 它 实 际 上 是 对 可 计算 过 程 的 定义 ,而 
非 证 明 。 但 迄今 为 止 ， 人 们 尚未 发 现 一 个 可 以 视 为 计算 的 过 程 是 图 灵机 不 能 模拟 的 。 


计算 


说 了 这 人 么 多 ,也 许 你 已 经 了 解 了 图 灵机 的 威力 ， 也 许 还 将 信 将 疑 ， 然 而 ， 你 肯定 
仍然 看 不 出 来 图 灵机 和 计算 有 什么 关系 。 实 际 上 ， 疼 灵机 是 一 个 理论 计算 机 模型 ， 它 
最 主要 的 能 耐 还 是 在 于 计算 上 。 下 面 我 们 就 来 看 看 什么 是 计算 。 

我 可 以 先 给 出 一 个 很 摩登 的 对 计算 概念 的 理解 : 如 采 我 们 把 一 切 都 看 作 信息 , 那 
么 广义 上 讲 ， 计 自 就 是 对 信息 的 变换 。 你 会 发 现 ， 其 实 目 然 界 充满 了 计算 。 如 有 果 我 们 
把 一 个 小 球 扔 到 地 上 ， 小 球 又 弹 起 来 了 ,那么 大 地 就 完成 了 一 次 对 小 球 的 计算 。 因 为 
你 完全 可 以 把 小 球 的 运动 部 抽象 成 信息 ， 它 无 非 是 一 些 位 置 、 速 度 、 形 状 等 能 用 信息 
描述 的 东西 ， 而 大 地 把 小 球 弹 起 来 无 非 是 对 小 球 的 这 些 信 息 进 行 了 某 种 变换 ， 因 而 大 
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地 就 完成 了 一 次 计算 。 你 可 以 把 整个 大 地 看 作 一 个 系统 ， 而 扔 下 去 的 小 球 是 对 这 个 系 
统 的 输入 ,那么 弹 回 来 的 小 球 就 是 该 系统 的 输出 ， 因 而 也 可 以 说 ,计算 就 是 茶 个 系统 
完成 了 一 次 从 输入 到 输出 的 变换 。 


这 样 理解 不 要 紧 ,， 你 会 发 现 , 现实 世界 到 处 部 是 计算 了。 因为 我 们 完全 可 以 把 所 
有 的 目 然 界 存在 的 过 程 邦 抽 和 象 成 这 样 的 输入 输出 系统 , 所 有 的 大 目 然 存在 的 变量 部 看 
作 信 息 ， 因 而 计算 无 处 不 在 。 的 确 ， 正 是 采取 了 这 样 的 观点 ， 人 们 才 有 可 能 发 明 什 么 
DNA 计算 机 、 生 物 计算 机 、 量 子 计算 机 这 些 新 鲜 玩 记 儿 。 因 为 人 们 把 DNA 的 化 学 反 
应 、 量 子 世 界 的 波 孔 数 变 换 部 看 作 计算 了 ， 目 然 束 会 人 为 地 把 这 些 计算 组 合 起 来 构成 
计算 机 了 。 


下面 回 到 图 灵机 。 为 什么 说 图 灵机 是 一 个 计算 的 装置 呢 ? 很 简单 ， 图 灵机 也 是 一 
个 会 对 输入 信息 进行 变换 给 出 输出 信息 的 系统 。 以 前 面 说 的 小 虫 为 例 ， 纸 市 上 一 个 方 
格 一 个 方 格 的 颜色 信息 就 是 对 小 虫 的 输入 ， 而 小 虫 所 采取 的 行动 就 是 它 的 输出 。 似 乎 
小 虫 的 输出 太 简 单 了 ， 因 为 它 仅仅 就 有 那么 几 种 简单 的 输出 动作 。 然 而 ， 复 杂 性 来 源 
于 组 合 。 虽 然 每 一 次 小 虫 的 输出 动作 都 很 简单 ， 然 而 当 我 们 把 所 有 这 些 输出 动作 组 合 
在 一 起 , 它 就 有 可 能 非常 复杂 了 。 比如 我 们 可 以 把 初始 时 刻 的 整个 纸 市 看 作 输入 信息 ， 
那么 经 过 任意 长 的 时 间 ， 比 如 说 100 年 后 ， 小 虫 通 过 不 断 地 涂抹 纸 这 ， 最 后 留 下 的 信 
县 就 是 输出 信息 ， 那 么 小 虫 完成 的 过 程 就 是 一 次 计算 。 事 实 上 ， 在 图 灵机 的 严格 定义 
中 ， 存 在 一 个 所 谓 的 停机 状态 ， 当 图 灵机 一 到 停机 状态 ， 我 们 就 认为 它 计 算 完 毕 了 ， 
因而 不 用 费劲 地 等 上 100 年 。 


计算 的 组 合 

观 有 意思 的 是 ,我 们 可 以 把 夺 二 个 计算 系统 进行 合并 ,构成 更 大 的 计算 系统 。 比 
如 还 是 那个 小 球 ， 如 采 往 地 上 放 了 一 个 跷 跷 板 ， 小 球 折 到 地 上 会 弹 起 这 个 蹊跷 板 的 万 
一 器， 而 跷 跷 板 的 万 一 中 可 能 还 是 一 个 小 球 ， 于 是 这 个 弹 起 的 小 球 又 会 磺 回 太一 个 跷 


我 们 上 自然 可 以 通过 组 合 右 干 图 灵机 完成 更 大 更 多 的 计算 , 如 果 把 一 个 岁 灵 机 对 纸 
市 信息 变换 的 结 来 输入 给 为 一 台 图 灵机 , 然后 再 输入 给 别 的 图 灵机 …… 这 就 是 把 计算 
进行 了 组 合 。 也 许 你 还 在 为 前 面 资 的 无 限 多 的 内 部 状态 和 无 限 复 杂 的 程序 而 吾 恼 ， 那 
么 现在 不 难 明 白 ， 实际 上 我 们 并 不 知 要 写 出 无 限 复杂 的 程序 列表 ，, 仪 仅 将 这 些 图 灵机 
组 合 到 一 起 丈 可 以 产生 复杂 的 行为 了 。 
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有 了 图 灵机 的 组 合 ， 我 们 就 能 够 从 最 简单 的 图 灵机 开始 构造 复杂 的 图 灵机 。 那 么 
最 简单 的 图 灵机 是 什么 呢 ? 我 们 知道 最 简单 的 信息 就 是 0 和 1， 最 简单 的 计算 就 是 对 
0 或 1 进行 的 布尔 运算 。 而 布尔 运算 本 质 上 其 实 就 三 种 : 与 、 或 、 非 。 从 最 简单 的 逻 
辑 运 算 操 作 最 简单 的 二 进 制 信息 出 发 , 我 们 其 实 可 以 构造 任意 的 图 灵机 。 这 点 不 难 理 
解 : 任何 图 灵机 都 可 以 把 输入 、 输 出 信息 进行 01 编码 ， 任 何 一 个 变换 也 可 以 最 终 分 
解 为 对 01 编码 的 变换 , 而 对 01 编码 的 所 有 计算 都 可 分 解 成 前 面 说 的 三 种 运算 。 也 许 ， 
现在 你 明白 了 为 什么 研究 计算 机 的 人 都 要 去 研究 基本 的 布尔 电路 。 奥 秘 就 在 于 ,用 布 
尔 电路 可 以 组 合 出 任意 的 图 灵机 ( 详 见 本 书 第 3 章 )。 


征服 无 限 的 方法 
回忆 你 小 时 候 是 如 何 学 会 加 法 运算 的 。 刚 开始 的 时 候 ， 你 仅仅 会 死记 硬 背 。 比 如 
你 记 住 了 1+1=2, 2+4=6,…… 。 然 而 无 论 你 记 住 多 少 固定 数字 的 运算 ， 都 不 叫 学 


会 了 加 法 。 原 因 很 简单 ， 假 如 你 记 住 了 z 对 数 的 加 法 ,那么 我 总 会 拿 出 第 ntl 对 数 是 
你 没有 记 住 的 ， 因 此 你 还 是 不 会 计算 。 原 则 上 ， 目 然 数 的 个 数 是 无 穷 的 ,任何 两 个 数 
的 加 法 可 能 绪 采 也 是 无 穷 的 。 如 打 采 用 死记 便 育 的 方法 ,我 们 的 头脑 怎么 可 能 记 住 无 
穷 多 个 数字 的 计算 法 则 呢 ? 但 是 随 着 年 龄 的 增长 ， 你 毕竟 还 是 最 终 学 会 了 加 法 运算 ! 
说 来 奇怪 ,你 肯定 明日 其 实 加 法 运算 并 不 需要 记 住 所 有 数字 的 运算 结 末 , 仪 仅 需 要 记 
住 10 以 内 的 任意 两 个 数 的 和 ， 并 且 懂 得 进位 法 则 就 可 以 了 。 


你 是 怎么 做 到 的 呢 ? 假设 要 计算 32 + 69 的 加 法 结果 , 你 会 把 32 写 到 一 行 , 把 69 
写 到 下 一 行 ， 然 后 把 它们 对 齐 。 于 是 你 开始 计算 2+9=11， 进 一 位 ， 然 后 计算 3+6= 
9， 再 计算 9+ 1= 10， 再 进 一 位 ， 最 后 ， 再 把 计算 的 每 一 位 的 结果 都 拼 起 来 就 是 最 终 
的 答案 101。 这 个 简单 例子 给 我 们 的 局 发 就 是 : 做 加 法 的 过 程 就 是 一 个 机 械 的 计算 过 
程 ， 这 里 的 输入 就 是 32 和 69 这 两 个 数字 ， 输 出 是 101。 而 你 的 程序 规则 就 是 把 任意 
两 个 10 以 内 的 数 求 和 。 这 样 ， 根 据 固定 的 加 法 运算 程序 你 就 可 以 计算 任意 两 个 数 的 
加 法 本 。 

不 知 你 发 现 了 没有 , 这 个 计算 加 法 的 方法 能 够 让 你 找到 运用 有 限 的 规则 应 对 无 限 
可 能 情况 的 方法 。 我 们 刚才 说 了 ， 实 际 上 自然数 是 无 限 的 ， 所 有 可 能 的 加 法 结果 也 是 
无 限 的 。 然 而 运用 刚才 说 的 运算 方法 ,无论 输入 的 数字 是 多 少 ， 只 要 你 把 要 计算 的 数 
字 写 下 来 ， 就 一 定 能 够 计算 出 最 终 的 结果 ， 而 无 需 死 记 硬 背 所 有 的 加 法 。 


因而 ， 可 以 说 计算 这 个 简单 的 概念 是 一 种 用 有 限 来 应 对 无 限 的 方法 。 我们 再 看 一 
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个 例子 , 假如 给 你 一 组 数 对 : (1,2)(3,6)(5,10)(18,36)， 这 时 间 你 102 对 应 的 数 是 多 少 ? 
很 显然 ,仅仅 根据 你 掌握 的 已 知 数 对 的 知识 ， 是 不 可 能 知道 答案 的 ， 因 为 你 的 知识 库 
里 面 没有 存放 着 102 对 应 数字 的 知识 。 然而, 如果 你 掌握 了 产生 这 组 数 对 的 程序 法 则 ， 
也 就 是 看 到 如 果 第 一 个 数 是 x， 那 么 第 二 个 数 就 是 2x 的 话 ， 你 肯定 一 下 子 就 算出 102 
对 应 的 是 204 了 。 也 就 是 说 ， 你 实际 上 运用 2x 这 两 个 字符 就 记 住 了 无 限 的 诸如 
(1,2)(3,6)(102,204) 这 样 的 数 对 。 


这 看 起 来 似乎 很 奇怪 。 我 怎么 可 能 运用 有 限 的 字符 来 应 对 无 限 种 可 能 呢 ?” 实 际 
上 , 当 没 有 人 间 你 问题 的 时 候 , 你 存储 的 2x 什么 用 也 没有 ,而 当 我 问 你 102 对 应 的 是 
多 少时 ， 我 就 相当 于 给 你 输入 了 信息 102， 而 你 仅仅 是 根据 这 个 输入 信息 102， 进 行 
一 系列 的 加 工 变换 得 到 了 输出 信息 204。 因 而 输入 信息 就 好 比 是 原材料 ， 你 的 程序 规 
则 就 是 加 工 的 方法 ， 只 有 在 原材料 上 进行 加 工 ， 你 才能 输出 最 终 产品 。 


这 让 我 不 葵 想 起 了 专家 系统 方法 。 其 实 专 家 系统 就 是 一 个 大 的 规则 库 ， 相 当 于 存 
储 了 很 多 (1,2)(3,6)(5,10) 这 样 特 殊 的 规则 对 。 但 它 存储 的 东西 再 多 ， 总 归 会 是 有 限 的 ， 
你 只 要 找到 一 个 它 没 有 存储 到 的 问题 ， 它 就 无 能 为 力 了 。 因 而 专家 系统 就 会 在 你 问 到 
102 对 应 多 少 的 时 候 失 败 。 如 何 解 决 问题 ? 人们 想 出 了 很 多 方法 ， 比 如 元 规则 。 其 实 
元 规则 就 相当 于 刚才 所 说 的 计算 加 法 的 程序 ， 或 者 2x 这 样 的 东西 。 运 用 元 规则 的 确 
可 以 应 对 无 限 种 情况 了 。 所 以 ， 这 就 是 你 问 计算 机 任何 两 个 数 相 加 是 多 少 ， 它 总 能 给 
出 你 正确 答案 的 原因 ， 虽 然 它 不 必 记 住所 有 这 些 加 法 对 的 信息 。 


然而 仅仅 是 元 规则 就 能 解决 所 有 问题 吗 ? 假 如 给 你 三 组 数 对 ， 排 列 成 一 张 表 : 


1,2 3,6 4,8 100,200 


3,9 20 8,24 100,300 
1,4 2,8 3,12 100,400 


那么 请 问 在 第 6 行 上 , 3 这 个 数字 对 应 的 是 多 少 ? 我 们 先 要 找 出 第 一 行 的 规律 是 
2x 没有 疑问 , 第 二 行 呢 ?” 是 3x， 第 三 行 是 4x, 那么 第 6 行 就 应 该 是 7x 了， 因而 在 第 
6 行 上 3 应 该 对 应 的 是 21! 跟前 面 不 太一 样 的 是 , 虽然 我 们 得 到 了 每 一 行 的 规则 比如 
2x， 但 是 随 着 行 数 的 增加 ， 这 个 规则 本 身 也 变化 了 : 第 2 行 是 3x， 第 3 行 是 4x， 
而 我 们 又 得 到 了 一 个 规则 本 喘 的 规则 , 即 如 果 行 数 是 n 的 话 , 那么 这 一 行 的 规则 就 是 
(n+1)x。 我 们 显然 能 够 根据 输入 的 n 和 x 计算 出 数值 。 在 专家 系统 里 ， 这 种 原理 就 是 
元 规则 的 规则 ， 元 元 规则 ……， 应 该 是 无 穷 的 。 然 而 专家 系统 本 里 并 不 会 自动 归纳 这 
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些 规 则 ， 人 必须 事 和 匈 把 这 些 元 规则 写 到 程序 里 ， 这 就 是 专家 系统 最 大 的 区 六 。 而 我 们 
人 似乎 总 能 在 一 些 个 别 的 事件 中 归纳 出 规则 。 进 一 步 问 ， 机 融 可 以 归纳 吗 ? 这 就 相当 
于 说 : 可 以 为 归纳 方法 编 出 程序 吗 ? 这 也 是 一 个 很 有 趣 的 问题 , 下 面 我 们 会 详细 讨论 。 
可 以 设想 , 假如 我 们 找到 了 真正 归纳 的 方法 ,那么 编写 出 这 样 的 程序 ， 它 就 会 一 秀水 
逸 地 日 己 进行 学 习 归纳 了 。 我 们 再 也 不 用 给 它 编 制程 序 和 规则 了 。 这 正 是 人 工 知 能 的 
终极 目标 。 


归纳 * 


金庸 在 他 的 武侠 小 说 《倚天 民 龙 记 》 中 曾 讲述 了 这 样 一 段 故 事 : 武林 泰斗 张三丰 
在 情急 之 下 要 把 他 新 创 的 武功 “太极 拳 ”传授 给 新 起 之 秀 张 无 尽 。 张 无 尽 除 了 有 一 身 
精湛 的 “内 功 修 为 ”外 ， 还 对 武 学 具有 极 高 的 悟性 。 当 张三丰 给 他 打 过 一 直 太 极 产 以 
后 , 他 就 把 所 有 的 招式 全 部 记 下 来 了 , 并 且 当 场 把 所 学 的 太极 拳 重新 再 打 给 张三丰 看 。 
在 张 无 鼠 练 拳 的 过 程 中 ， 张 三 丰 反 复 问 他 一 个 问题 :“ 你 已 经 忘掉 几 招 了 ? ”张无忌 
的 回答 令 在 场 的 其 他 人 异常 不 解 ， 因 为 他 越 在 那里 撕 摩 太极 拳 的 奥秘 ， 忘 记 的 招数 就 
越 多 。 劳 边 的 人 不 明白 ， 这 样 的 学 法 忘 得 这 么 快 ， 怎 么 可 能 学 会 武功 呢 ? 然而 ， 没 过 
多 长 时 间 ， 张 无 忌 说 已 经 忘掉 了 所 有 的 招式 。 张 三 丰 笑 着 说 :“ 不 错 ， 你 终于 学 会 了 
:太极 郑 ' 


从 这 个 例子 中 ,我们 看 到 了 什么 ?张无忌 之 所 以 能 学 会 太极 壮 ， 是 因为 他 已 经 能 
够 从 具体 的 一 招 一 式 中 抽象 出 更 高 层次 的 武 学 规律 了 ,因而 ， 当 把 所 有 有 形 的 武功 招 
数 都 起 记 的 时 候 ， 他 已 经 和 掌握 了 太极 拳 的 精髓 。 太 极 武 功 讲究 的 就 是 什 力 打 力 ， 以 柔 
克 刚 。 说 日 ,就 是 事先 并 没有 固定 招式 存在 ,等 到 敌人 进攻 的 时 候 再 动态 地 生成 破 
解 的 招 术 。 


运用 到 图 灵机 模型 中 ， 我 们 不 难 发 现 ， 如 条 把 具体 的 武功 招 术 比 喻 成 一 些 输入 ， 
把 应 对 招 术 比 喻 成 图 灵机 的 输出 ,那么 太极 所 讲究 的 借 力 打 力 、 以 柔 殉 刚 的 方法 其 实 
就 是 类 似 2x 这 样 的 图 灵 程 序 。 因 而 张无忌 学 太极 将 的 过 程 就 是 从 特殊 的 输入 输出 提 
升 到 一 般 算 法 的 过 程 ， 也 可 以 说 ， 张 无 忌 运 用 了 归纳 学 习 法 。 


然而 ,和 仔细 观察 上 一 慷 的 叙述 ， 我 们 就 会 发 现 ， 虽然 图 灵机 能 够 将 2x 这 样 的 法 则 
计算 得 出 结 末 ,但 是 抽象 出 2x 本 号 并 不 是 机 各 目 动产 生 的 ， 而 是 需要 我 们 外 在 的 人 编 
程 进去 。 那 么 ， 面 对 这 样 的 问题 ， 图 灵机 究竟 能 不 能 像 张无忌 一 样 进行 归纳 思维 呢 ? 


可 以 设想 ， 如 条 计算 机 真有 了 张无忌 那 两 下 子 ， 我 们 人 类 可 要 省 事 儿 多 了 。 我们 
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其 至 不 需要 为 计算 机 编程 序 , 它 就 会 日 动 从 奉 干 个 具体 事例 中 归纳 出 一 般 的 通用 规律 。 
然而 ， 计 算 机 究竟 能 不 能 具有 真正 的 归纳 能 力 呢 ? 让 我 们 来 仔细 考虑 下 面 这 个 问题 。 


如 有 果 计 算 机 能 自动 归纳 ， 也 就 意味 着 我 们 可 以 为 归纳 方法 编写 一 段 程序 P。 这 个 
程序 可 以 理解 为 输入 的 是 一 些 特殊 的 数 对 ,输出 的 是 能 够 生成 这 些 数 对 的 程序 。 也 就 
是 说 输入 具体 的 “ 招 术 ”， 输 出 的 是 这 些 “ 招 术 ” 的 一 般 规 律 。 如 果 程 序 P 真 的 可 以 
上 归纳， 那么 P 就 必然 可 以 归纳 出 所 有 的 规律 。 我 们 已 经 讨论 过 了 ， 其 实 任何 一 个 程序 
都 能 够 被 看 作对 输入 的 一 个 变换 而 得 到 输出 。 那 么 程序 P 自然 也 是 。 假 设 这 些 对 子 
(a,b), (c,d), (e,f), 都 是 程序 P 的 输入 输出 对 ， 那 么 我 们 挑选 出 前 1000 个 〈 总 而 
言 之 是 足够 多 的 对 子 )。 把 这 1000 个 特殊 情况 输入 到 P 中 ,那么 P 就 应 该 能 够 产生 这 
些 对 子 的 共性 ， 也 就 是 P 自己 这 个 程序 了 。 换 句 话 说， 程序 了 产生 了 它 自己 , 了 自 己 
把 自己 给 归纳 出 来 了 。 这 似乎 陷入 了 怪圈 之 中 ! 另外 ， 我 们 人 类 设计 出 来 P， 如 果 了 了 
可 以 归纳 所 有 的 规律 ， 那 么 P 了 能 否 归纳 出 “人 归纳 P” 本 和 刁 这 个 规律 呢 ? 仍然 是 怪圈 
问题 ! 这 样 的 问题 似乎 还 有 很 多 。 事 实 上 ， 索 洛 莫 诺 夫 ( Solomonoff ) 很 早 就 提出 了 
通用 归纳 (universal reduction ) 模型 ， 并 对 这 个 问题 给 出 了 明确 的 回答 : 虽然 我 们 可 
以 数学 地 写 出 通用 归纳 模型 ， 但 它 却 是 不 可 计算 的 ， 也 就 是 程序 P 并 不 存在 ， 这 与 后 
面 讨论 的 图 灵 停 机 程序 有 关 。 详 细 讨 论 请 参见 本 书 第 5 章 。 我 们 将 会 看 到 还 有 很 多 问 
题 都 涉及 了 逻辑 中 的 怪圈 ， 而 由 于 计算 理论 已 经 触及 了 逻辑 、 信 息 的 根本 ， 所 以 把 一 
些 问 题 引 回 逻 和 辑 怪圈 并 不 奇怪 。 


模拟 


什么 是 模拟 ? 又 是 一 个 基本 的 问题 ,阿尔 但 特 : 爱 因 斯 坦 说 过 ， 越 是 基本 的 概念 
就 越 是 难以 刻画 清 想 。 模 拟 这 个 概念 就 是 一 个 很 难说 消 的 问题 。 

如 条 你 站 在 一 个 朋友 面前 ， 冲 着 他 做 了 一 个 鬼 腔 。 那 么 他 也 会 学 春 你 的 动作 冲 你 
做 购 脸 ， 那 么 他 就 对 你 进行 了 模拟 。 

很 明显 ,在 你 和 你 朋友 之 间 存 在 着 一 系列 的 对 应 关系 : 你 的 手 对 应 他 的 手 , 你 的 
眼睛 对 应 他 的 眼睛 ， 你 的 嘴巴 对 应 他 的 嘴巴 …… 而 且 你 的 手 、 了 眼睛、 嘴巴 做 出 来 的 动 
作 也 会 对 应 他 的 手 、 眼 睛 、 嘴 巴 做 出 来 的 动作 。 因 而 ,模拟 的 关键 是 对 应 。 如 琳 集 合 
A 中 的 元 系 可 以 完全 对 应 B 中 的 元 系 ， 那 么 A 就 可 以 模拟 B。 


仍然 是 以 做 鬼脸 为 例 , 假如 这 次 你 做 出 的 鬼脸 以 及 动作 没有 被 他 立即 模仿 而 是 被 
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他 用 某 种 符号 语言 记录 到 了 日 记 本 上 ,比如 “X 年 X 月 X 日 , 闷 子 XX 冲 我 做 了 一 个 
鬼脸 : 他 伸 出 了 左手 食指 放 到 了 右 眼 下 面 往 下 拉 他 脸 上 的 肉 ， 并 且 吐 出 了 他 长 长 的 天 
头 1”。 过 了 NN 多 天 后 ,你 的 这 位 朋友 掏 出 了 日 记 本 , 按照 上 面 的 描述 冲 看 大 家 做 了 这 
个 鬼 腔 。 很 显然 他 仍然 醒 拟 了 你 当时 的 动作 。 那 么 ， 你 朋友 日 记 本 上 的 那 段 描述 是 不 
钙 对 你 鬼脸 动作 的 模拟 呢 ? 答案 似乎 是 否 ， 因 为 这 段 文字 跟 你 没有 半点 相像 。 然 而 你 
的 朋友 正 是 根据 这 段 措 述 才 做 出 了 对 鬼脸 动作 的 模拟 。 也 就 是 痪 ,他 把 那 段 文字 翻 详 
成 了 他 的 动作 ， 而 他 这 个 动作 就 是 对 你 的 梗 拟 。 这 个 翻 详 的 过 程 很 显然 就 是 茶 种 信息 
的 变换 ， 我 们 完全 可 以 把 它 理解 为 一 个 计算 的 过 程 ， 也 就 是 可 以 用 岁 灵 机 来 实现 的 算 
法 过 程 。 所 以 ,我们 说 日 记 本 上 的 那 段 指 令 也 构成 了 对 你 鬼脸 动作 的 模拟 ， 原 因 是 这 
些 信 息 也 与 你 的 鬼脸 动作 构成 了 对 应 。 有 具体 的 ， 我 们 可 以 用 图 2-19 表示 。 


2-19 ”模拟 


图 中 A 是 你 的 鬼脸 动作 ，B 是 你 朋友 做 出 来 的 鬼脸 动作 ，C 是 日 记 本 上 的 描述 。 
你 朋友 的 动作 B 模 拟 了 你 的 动作 A， 而 了 B 的 动作 信息 是 通过 执行 C 上 的 描述 得 到 的 ， 
也 就 是 说 ， 存 在 春 一 个 从 C 到 B 的 信息 变换 。 这 样 我 们 认为 C 也 对 A 进 行 了 模拟 。 


图 灵机 之 间 的 模拟 


下 面 来 考虑 图 灵机 之 间 的 檬 拟 。 按 照 前 面 的 定义 ,一 台 图 灵机 包括 输入 集合 I、 
输出 集合 O、 内 部 状态 集合 S、 程 序 规则 表 工 四 个 要 系 。 那 么 ， 如 果 两 个 图 灵机 之 间 
的 这 些 元 系 都 存在 刚才 说 的 对 应 关系 ， 就 认为 这 两 个 网 灵机 可 以 相互 模拟 了 。 人 然而 网 
灵机 的 功能 是 完成 对 输入 信息 进行 变换 得 到 输出 信息 的 计算 。 我 们 关心 的 也 仅仅 是 输 
入 输出 之 间 的 对 应 关系 。 因 而 一 台 图 灵机 A 如 果 要 模拟 B, 并 不 一 定 要 模拟 B 中 的 所 
有 输入 、 输 出 、 内 部 状态 、 程 序 规则 表 这 些 元 系 ， 而 只 要 在 给 定 输入 信息 的 时 候 能 够 
模拟 B 的 输出 信息 就 可 以 了 。 


因此 ， 我 们 可 以 用 图 2-20 来 表示 图 灵机 之 间 的 模拟 。 
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图 2-20 图 灵机 之 间 的 模拟 


模拟 


输入 信息 i 


输出 信息 0' 


也 就 是 说 ， 在 给 定 相 同 输入 信息 的 情况 下 ， 只 要 输出 信息 o' 能 够 模拟 信息 
就 认为 B 模 拟 了 A。 而 信息 o' 对 信息 o 的 模拟 又 4 We 
定义 。 也 就 是 说 ， 如 果 存 在 另外 一 台 图 灵机 能 够 把 信息 o' 计 算 并 映射 成 信息 o， 就 认 
为 o' 模 拟 了 o。 说 日 了 也 就 是 o' 可 以 与 o 不 一 样 , 但 是 只 要 你 能 用 一 pie 0' 经 
过 一 系列 运算 变换 到 相同 的 o。， 就 认为 o' 模 拟 了 o。 因 而 也 就 是 图 灵机 B 模拟 了 图 灵 
机 A。 


一 步 地 ， 我 们 可 以 假设 A 和 B 输入 的 信息 也 不 一 样 ， 一 个 是 i， 为 一 个 是 


那么 如 果 i 和 六 之 间 也 存在 着 模拟 对 应 关系 的 话 ， 我 们 仍然 认为 B 可 以 模拟 A， 如 图 
2-21 所 示 。 


和 信息 已 和 信息 人 > A 人 息 人 


人 息 人 


和 信息 六 忆 和 信息 六 


图 2-21 图 灵机 之 间 的 模拟 


有 一 点 需要 注意 ， 如 果 A 图 灵机 模拟 了 B 图 灵机 ， 那 么 B 图 灵机 并 不 一 定 可 以 
模拟 A 图 灵机 。 因 为 有 可 能 A 图 灵机 比 B 图 灵机 处 理 的 信息 更 多 。 也 就 是 说 假如 B 
BE 处 理 的 信息 就 是 1,2,3,4， 而 A 处 理 的 信息 除了 这 四 个 数 之 外 , 还 有 5$,6,7,8， 那 么 显 
然 当 输入 1,2,3,4 的 时 候 A 能 够 模拟 B， 而 当 输 入 5,6,7,8 的 时 候 B 就 没 定义 了 ,不 能 
完成 任何 操作 ， 这 时 B 显然 不 能 模拟 A 了 。 
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计算 等 价 性 

讲 了 这 么 多 关于 模拟 的 知识 有 什么 用 呢 ?” 模 拟 的 一 个 关键 作用 就 是 阐明 什么 是 
等 价 的 。 比 如 为 了 完成 加 法 运算 , 你 写 了 一 段 程 序 , 我 也 写 了 一 段 程序 , 虽然 我 们 两 个 
的 程序 可 能 完全 不 一 样 , 然而 只 要 我 们 两 个 程序 之 间 能 够 相互 模拟 , 也 就 是 说 只 要 给 定 
两 个 数 ， 我 们 都 能 正确 地 一 模 一 样 地 算出 它们 的 和 ， 那 么 我 们 两 个 程序 就 是 等 价 的 。 

具体 地 说 ， 如 果 A 能够 模拟 B， 并 且 B 也 能 模拟 A， 那 么 A 和 B 就 是 计算 等 价 
的 。 计 算 等 价 性 是 非常 强 有 力 的 ， 因 为 它 揭示 了 在 我 们 这 个 宇宙 中 某 种 非常 普 志 的 规 
律 。 我 们 仍然 以 刚才 说 的 加 法 算法 为 例 来 说 明 。 虽 然 计 算 两 个 数 的 加 法 的 方法 可 能 
无 穷 多 种 ， 也 有 可 能 用 各 种 各 样 的 计算 机 编程 语言 如 C、Basic、Java 等 来 实现 ， 更 有 
可 能 跑 在 不 同 的 计算 机 上 ， 然 而 所 有 这 些 程序 ， 这 些 计算 的 结果 意义 都 是 相同 的 。 也 
就 是 说 ， 所 有 与 加 法 运算 算法 计算 等 价 的 计算 机 程序 都 是 一 回 事 儿 ， 因 而 加 法 算法 这 
个 东西 是 永恒 而 独立 的 。 

看 ! 我 们 在 宇宙 中 找到 某 种 永恒 性 了 ,这 种 永恒 性 反映 了 宇宙 规律 中 某 种 本 质 上 
的 美 。 计 算 等 价 性 就 和 能 量 守恒 定律 一 样 具 有 这 种 高 级 的 对 称 性 ,我 甚至 觉得 计算 等 
价 性 要 比 能 量 守 恒定 律 更 加 深刻 。 因 为 无 论 如 何 能 量 守 恒定 律 仍然 刻画 了 物理 系统 的 
某 种 属性 ， 而 计算 等 价 性 刻画 的 则 是 非常 广泛 的 信息 系统 之 间 的 对 称 性 ， 而 一 切 系 统 
都 可 以 被 抽象 为 信息 系统 ， 甚 至 是 物质 世界 。 所 以 ， 计 算 等 价 性 是 跨越 所 有 系统 之 间 
的 某 种 高 级 对 称 的 、 永 恒 的 、 美 的 东西 。 

为 了 进一步 理解 计算 等 价 性 的 威力 所 在 , 我 们 不 妨 科 幻 一 下 。 假 设 我 们 能 够 用 计 
算 机 模拟 某 个 人 比如 张 三 的 思维 过 程 , 也 就 是 说 我 们 可 以 用 一 个 计算 机 软件 X 来 完成 
对 张 三 思 维 的 模拟 。 那 么 ， 这 个 软件 就 会 在 一 切 与 它 具 有 计算 等 价 性 的 程序 甚至 系统 
上 实现 张 三 这 个 人 的 思维 过 程 。 比 如 我 们 完全 有 可 能 让 一 大 堆 分 子 的 碰撞 来 实现 又 这 
个 软件 ， 那么 就 会 在 这 一 大 堆 分 子 碰撞 的 过 程 中 完成 对 张 三 思维 的 模拟 ,也 就 是 说 张 
三 这 个 人 的 意志 踊 到 这 一 大 堆 分 子 系统 中 去 了 。 更 进一步 ,我 们 还 可 以 找 来 足够 多 的 
人 (比如 这 个 星球 上 所 有 的 人 ) 来 模拟 这 一 大 堆 分 子 的 碰撞 , 从 而 完成 软件 和 的 计算 。 
这 意味 着 张 三 这 个 人 的 思维 或 者 说 意识 在 这 群 人 的 整体 上 突现 了 。 很 有 4 可能， 这 些 构 
成 软件 又 的 人 都 没有 意识 到 在 他 们 上 层 的 张 三 的 意识 的 出 现 。 更 有 趣 的 是 , 很 有 可 能 
张 三 上 自己 就 在 那 一 群 人 之 中 呢 。 


相信 你 已 经 能 够 参 司 到 计算 等 价 性 的 威力 了 , 那么 相信 你 能 够 理解 为 什么 说 任何 
一 台 我 们 使 用 的 计算 机 都 不 过 是 图 灵机 的 翻版 了 。 
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考虑 下 面 三 句 话 :“ 请 把 窗户 关上 !”“Please closethe window1”“01001110111”。 这 
三 句 话 分 别 说 给 不 同房 间 中 的 三 个 人 。 第 一 句 话 告诉 给 一 个 中 国人 ， 于 是 他 关上 了 窗 
户 ; 第 二 句 话 告诉 了 一 个 英国 人 ， 他 也 关上 了 窗户 ; 第 三 句 话 告诉 的 是 一 个 机 带 人 ， 
他 也 关上 了 窗户 。 这 三 句 话 从 表面 上 看 显然 是 完全 不 一 样 的， 然而 当 它 们 说 给 不 同 的 
人 听 的 时 候 ， 最 终 却 达 到 了 相同 的 效果 : 窗户 被 天 上 了 了。 那么 ,我 们 目 然 会 想 ， 这 三 
句 话 有 何 相同 之 处 呢 ? 显然 ， 答 案 是 它们 的 意义 相同 。 然 而 什么 又 是 意义 呢 ? 


真正 回答 意义 的 本 质 是 一 个 很 困难 的 问题 ， 现 在 人 们 正在 努力 理解 语义 是 什么 。 
虽然 我 们 仍 没 有 完全 回答 这 个 问题 ,但 是 ,不妨 从 图 灵机 、 计 算 以 及 计算 等 价 性 的 观 
点 来 考 感 这 个 问题 。 如 宁 把 中 国人 、 英 国人 、 机 带 人 都 看 作 图 灵机 ， 把 那 三 句 话 看 作 
对 它们 的 输入 信息 ,那么 最 终 的 结果 就 是 图 灵机 计算 的 输出 。 这 个 时 候 我 们 看 到 三 种 
结果 是 相同 的 ， 也 就 是 说 这 些 图 灵机 之 间 是 可 以 相互 模拟 的 。 


这 三 句 话 具有 相同 的 意义 ， 而 根据 前 面 的 叙述 ,能够 相互 模拟 的 图 灵机 是 计算 等 
价 的 。 而 这 种 计算 等 价 性 就 像 前 面 说 到 的 加 法 规则 一 样 是 独立 于 计算 系统 和 执行 机 构 
的 。 因 而 ,我 们 能 得 到 图 2-22。 


全 人 指令 
请 把 窗户 关上 | 输入 指 信 


1 同意 义 1 计算 等 价 


全 和 指令 
Please close the window! 答 入 指 信 英国 人 
全 人 指令 
01001110111 入 入 指令 


相同 之 处 计算 等 价 性 


2-22 ”计算 等 价 性 


计算 等 价 
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通过 图 2-22， 我 们 不 难得 出 绪论 : 所谓 语言 的 意义 ， 就 是 执行 这 个 声言 系统 的 计 
算 等 价 性 。 

我 们 如 何 知 道 不 同 的 声言 表达 了 相同 的 意义 呢 ? 显然 ， 只 要 有 了 翻译 ， 我 们 就 
可 以 明白 “请 把 窗户 关上 ”与 “Please closethe window” 具 有 相同 的 意义 ， 而 翻译 所 做 
的 无 非 就 是 输入 中 文 信息 输出 英文 信息 这 样 的 信息 转换 工作 , 因而 , 也 就 是 一 个 计算 
过 程 。 

然而 ， 当 不 存在 从 一 种 语言 到 另外 一 种 声言 的 翻译 的 时 候 ， 我 们 也 并 不 能 断定 某 
一 个 符号 序列 对 于 固定 的 图 灵机 是 否 有 意义 。 例 如 ,我 们 虽然 不 能 明日 鸟 叫 是 什么 含 
义 ， 但 并 不 能 否认 它们 的 叫 声 可 能 有 意义 ， 因 为 只 有 鸟 目 己 才能 明日 叫 声 的 含义 。 


万 能 图 灵机 


剖面 已 经 讲述 了 模拟 的 概念 ， 那么 自然 会 产生 这 样 一 个 问题 是 否 存 在 一 台 图 灵 
机 能 够 模拟 所 有 其 他 的 图 灵机 呢 ? 答案 是 存在 的 。 这 种 能 够 模拟 其 他 所 有 图 灵机 的 图 
灵机 叫 作 通 用 图 灵机 (Universal Turing Machine )， 也 就 是 我 所 说 的 “万 能 图 灵机 ”。 
我 之 所 以 这 人 么 称呼 它 ， 是 因为 这 种 机 需 在 图 灵 计 算 这 个 范畴 内 是 万 能 的 。 

万 能 图 灵机 会 怎样 工作 呢 ? 假如 我 把 信息 x 输 入 到 了 图 灵机 M 中 ，M 残 能 计算 
出 一 个 结 采 o。 那么 如 采 我 把 x 和 M 的 信息 都 输入 给 万 能 图 灵机 , 那么 它 也 会 输出 o， 
也 就 是 万 能 图 灵机 可 以 模拟 任何 一 全 特殊 的 网 灵机 。 这样 的 话 我 们 仅仅 通过 改变 输入 
x 和 M 的 值 就 能 “改变 ”万 能 图 灵机 的 程序 规则 了 ， 因 而 也 可 以 认为 万 能 图 灵机 就 是 
可 以 任意 编程 的 。 这 里 的 “改变 ”两 个 字 加 上 了 引号 ， 是 因为 事实 上 任何 图 灵机 在 诞 
生 之 后 就 不 能 改变 规则 了 ， 因 而 虽然 看 上 去 改变 了 万 能 图 灵机 的 规则 ， 其 实 根本 没有 
必 多 5 


编码 

要 理解 为 什么 万 能 图 灵机 是 存在 的 以 及 它 怎 样 模拟 其 他 任何 图 灵机 的 动作 , 我 们 
必须 要 先 理解 究 葛 怎样 把 任何 一 台 图 灵机 输入 到 万 能 图 录 机 中 ,这 就 需要 理解 编码 的 
概念 。 什 么 是 编码 呢 ? 你 可 以 理解 为 对 某 一 堆 事 物 进 行 编号 。 

其 实 我 们 每 人 每 天 都 在 跟 编码 打交道 。 每 个 人 都 有 一 个 身份 证 ,里 份 证 部 有 一 个 
写 码 ， 那 么 这 个 号 码 就 是 人 的 编码 。 
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26 个 字母 能 够 被 编码 ， 比 如 a 对 应 1, b 对 应 2，…… ， 这 是 显而易见 的 。 然 而 任 
意 一 个 瑞 文 单词 都 可 以 被 编码 则 不 那么 容易 一 眼看 出 来 。 事实 上 ,我 们 可 以 按照 字典 
顺序 把 所 有 的 单词 部 列 出 来 。 字母 顺 序 越 匪 前、 字符 长 度 越 短 的 单词 排 在 前 面 ， 字母 
顺序 越 徘 后 、 字 符 长 度 越 长 的 单词 就 排 在 后 面 。 比 如 一 种 可 能 的 字典 顺序 如 下 所 示 : 


a, about, an..., bad, be, behave..... 

只 要 这 样 排 好 序 ， 我 们 就 能 给 每 个 单词 赋予 一 个 数字 ， 最 简单 的 方法 是 ， 给 第 一 
时 讽 亲本 1 区 三 个 他 配 2 0” 因而 我 们 就 给 所 有 的 单词 都 编码 了 。 

下 面 讨论 任 意 一 个 图 灵机 能 不 能 被 编码 。 我 们 假设 讨论 的 所 有 图 灵机 的 输入 集合 
都 仅 有 0,1 两 种 ， 而 它 的 输出 也 仅仅 有 0,1,2,3 四 个 动作 ， 分 别 表示 前 移 、 后 移 、 涂 写 
0、 涂 写 1。 而 内 部 状态 数 最 多 为 10 000 个 (总 之 足够 多 就 可 以 了 )。 

假设 图 灵机 的 程序 表 如 表 2-5 所 示 。 

表 2-5 ”图 灵机 程序 表 


当前 内 部 状态 (s) 输入 数值 (7) 输出 动作 (0) 下 一 时 刻 的 内 部 状态 (s” 
2 1 0 3 
1 0 3 2 
3 0 1 1 


那么 我 们 可 以 把 它 写 到 一 行 中 ， 这 就 是 2,1,0,3; 1,0,3,2; 3,0,1,1， 注 意 用 “,” 分 开 
了 内 部 状态 、 输 入 数值 、 输 出 动作 和 下 一 时 刻 的 状态 ， 而 用 “;” 分 开 了 一 行 一 行 具体 
的 程序 。 这 样 无 论 这 个 表 有 多 长 ， 我们 都 可 以 把 它 写 成 一 个 这 样 的 字符 串 。 这 个 字符 
串 就 相当 于 一 个 英文 单词 ， 这 就 是 对 该 图 灵机 程序 的 一 个 描述 。 同 理 ， 其 他 的 图 灵机 
也 能 够 得 到 这 样 的 一 个 单词 描述 ， 那 么 我 们 再 用 字典 友 的 方法 对 这 些 描述 进行 编码 ， 
就 得 到 了 对 所 有 图 灵机 的 编码 。 

如 果 一 台 图 灵机 的 编码 是 M， 它 恋人 入 的 信息 是 x， 这 样 只 要 把 M 和 x 用 “.” 号 
隔 开 ， 分 开 作为 数据 输入 到 万 能 图 灵机 中 ， 运 用 特殊 的 算法 ， 这 个 万 能 的 机 需 就 能 得 
出 对 M 计算 x 的 模拟 结果 了 ,事实 上 可 以 由 定理 证 明 万 能 图 灵机 对 于 任意 的 编码 都 是 
存在 的 ， 在 这 里 我 们 就 不 叙述 证 明 过 程 了 。 


目 食 其 尾 
既然 万 能 图 灵机 能 够 模拟 任何 一 台 图 灵机 的 动作 , 那么 它 能 不 能 模拟 它 自己 呢 ? 
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答案 是 肯定 的 。 我 们 首先 看 到 万 能 图 灵机 也 是 图 灵机 ， 也 有 固定 的 输入 、 输 出 、 状 态 
的 集合 、 固 定 的 程序 ， 因 而 它 也 能 被 编码 。 于 是 我 们 就 可 以 把 它 目 己 的 编码 信息 输入 
给 它 自 己 。 这 就 好 像 一 条 蛇 咬 到 了 目 己 的 尾巴 ,上 自 食 其 尾 就 会 产生 怪圈 ， 虽然 我 们 现 
在 还 没有 看 到 任何 不 好 的 征兆 ,然而 在 下 一 市 里 面 ,我 们 将 会 看 到 这 种 怪 峰 会 产生 什 
么 样 的 结论 。 而 且 在 第 4 章 我 们 也 会 看 到 ， 其 实 这 个 怪圈 是 和 康 托 尔 对 角 线 法 则 、 哥 
德尔 定理 有 关 的 。 


图 灵机 一 旦 能 够 把 程序 作为 数据 来 谈 写 ， 承 会 诞生 很 多 有 趣 的 事情 。 首 先 ， 存 在 
某 种 图 灵机 可 以 完成 自我 复制 。 事实 上 ,计算 机 病毒 就 是 这 样 干 的 。 我 们 简单 说 明 一 
下 这 个 特殊 的 网 灵机 是 如 何 构造 的 。 我 们 假定 ， 如 采 一 台 图 灵机 是 和 X, 那么 它 的 编码 
就 记 为 <X>。 这 样 能 够 自我 复制 的 图 灵机 的 功能 是 把 T 的 编码 <T> 写 到 纸 带 上 输入 
万 能 图 灵机 , 那么 万 能 图 灵机 就 能 根据 谈 入 的 <T> 执 行 了, 在 纸 禹 上 再 次 输出 <T> 的 一 
份 副 本 <T>'， 并 且 <T> = <T>'。 下 面 就 来 解释 如 何 构 造 这 样 的 T。 前 和 完 荆 由 两 部 分 构 
成 : A 和 B。 第 一 部 分 A 的 功能 是 指导 万 能 图 灵机 把 B 的 编码 <B> 原 封 不 动 地 打印 到 
纸 带 上 ， 纸 市 上 就 有 了 <B>， 如 采 这 个 时 候 你 想 用 同样 的 方法 打印 <A> 到 纸 市 上 是 不 
行 的 ， 因 为 A 就 会 打印 目 己 了 。 然而 B 却 可 以 这 样 做 : 谈 和 纸 市 上 的 信息 X, 生成 能 
人 够 打 Eh X 的 图 灵机 p(X) 的 编码 <p(X)>， 打 印 到 纸 帘 上 ， 并 把 X 和 <p(X)> 的 内 容 前 后 
调换 ， 有 定理 保证 这 样 的 图 灵机 是 存在 的 。 这 样 当 B 读 到 纸 市 上 的 信息 <B> 之 后 ,就 
会 打印 出 能 够 打印 <B> 的 图 灵机 的 编码 也 就 是 <A>, 然后 把 <A> 和 <B> 位 置 对 换 , 就 构 
成 了 <AB>，, 也 就 是 <ZP>， 所 以 了 把 目 己 进行 了 一 次 复制 。 初 看 起 来 ， 这 种 目 我 复制 的 
程序 是 不 可 能 的 ,因为 这 包含 了 无 穷 无 尽 的 怪圈 。P 要 能 产生 它 目 己 <P>， 就 意味 着 了 
中 至 少 包 含 了 一 个 <P>, 而 这 个 <P> 中 又 包含 了 至 少 一 个 <P>…… 最 后 P 必然 是 一 个 无 
限 大 的 程序 ， 然 而 我 们 却 能 够 证 明了 是 可 能 的 。 关 于 目 复 制 的 进一步 讨论 可 参见 本 书 
第 4 草 。 

有 了 万 能 图 灵机 ， 还 能 得 到 很 多 有 趣 的 结论 ， 比 如 假设 有 一 大 群 图 灵机 ， 让 它们 
随机 地 相互 碰撞 ， 当 碰 到 一 块 的 时 候 ,， 一 个 图 灵机 可 以 谈 入 为 一 个 图 灵机 的 编码 ， 并 
且 修 改 这 台 图 灵机 的 编码 。 那 么 这 样 一 个 图 录 机 “ 汤 ” 中 会 产生 什么 呢 ?” 美 国 圣 塔 
非 研 究 所 的 方 塔 纳 ( Walter Fontana ) 完成 了 这 个 实验 ， 并 得 出 了 惊人 的 结论 : 在 这 
样 的 系统 中 会 诞生 自我 维护 的 类 似 生 命 的 复 森 组织, 而且 这 些 组 织 能 进一步 联合 起 来 
构成 更 大 的 组 织 ! 
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停机 问题 


尽管 图 录 机 如 此 强大 , 它 也 有 解决 不 了 的 问题 。 例 如 ,一 个 闭 名 的 不 可 解 问题 束 
是 图 灵 集 机 问题 。 


死人 循环 

还 记得 我 们 前 面 提 到 的 可 怜 的 “小 虫 ” 吗 ? 当时 我 们 就 提出 来 一 个 问题 : 会 不 会 
存在 菏 种 聪明 的 算法 P， 只 要 检查 一 下 小 虫 的 程序 和 纸 市 信息 ， 而 不 用 执行 它 ， 就 能 
够 让 我 们 预言 小 虫 是 否 会 陷 人 和 死 循 环 ， 无 休止 地 重复 前 面 的 动作 ? 

我 们 不 妨 设 P(X,Y) 表 示 P 了 判断 程序 久 作 用 到 数据 ( 纸 市 )Y 上 是 否 存 在 死 循环 的 结 
采 。 如 采 义 作用 到 YY 上 存在 死 循环 ， 那么 P(X,Y) 就 输出 一 个 yes; 否则 就 输出 一 个 no。 

可 惜 的 是 , 这 种 判断 任意 程序 作用 到 任意 数据 上 是 否 停 机 的 程序 P 并 不 存在 。 我 
们 可 以 给 出 一 个 证 明 。 

在 进行 正式 讨论 之 前 ， 我 们 先 来 看 一 个 非 稼 简单 的 猜 便 币 游戏 。 

假如 我 两 只 手中 有 一 个 的 看 一 枚 硬币， 另 一 个 什么 都 没有 ,然后 让 你 猜 硬币 在 哪 
个 手中 ? 于 是 你 告诉 我 左手 。 这 时 候 我 不 会 把 手 张 开 ， 而 是 背 过 号 去 做 一 番 手 脚 ， 
然后 把 手 伸 过 来 ， 张 开 手 ! 哈 ， 你 错 了 吧 ， 便 币 在 右手 中 |! 

大 概 俊 子 都 能 看 出 来 我 的 仪 俩 之 所 在 。 不 用 说 ， 采 用 这 种 方法 我 保证 百 战 百胜 。 
因为 我 总 是 等 你 说 出 来 是 哪 只 手 有 便 币 之 后 再 动态 地 改变 我 的 策略 。 所 以 ， 改 变 之 后 
的 状态 已 经 不 是 你 猜 的 了 。 

大 概 你 会 觉得 不 可 思议 : 其 实 图 录 集 机 问题 的 证 明 就 与 这 个 游戏 有 点 类 似 。 

我 们 采用 反 证 法 ,假设 P 程 序 存 在 。 那 么 我 们 可 以 根据 了 设计 一 个 新 的 程序 Q: 

Program Q(X){ 


m=P (X,X) 
do while (m=no) 


end do 
if m=yes then return 


} 
这 里 的 X 是 一 个 程序 的 编码 。 
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这 段 程序 通俗 来 讲 就 是 : 输入 任何 一 段 程序 X, 调用 另 数 P(X,X) 并 得 到 返回 值 m， 
如 果 m=no, 根据 了 的 定义 , P 判 断 出 程序 和 作用 到 它 目 己 吴 上 和 不 存在 死 循 环 。 那 么 
Q 就 不 停 地 做 do while 和 end do 之 间 的 语句 。 如 果 m=yes， 这 表示 了 判断 出 程序 X 
在 X 上 存在 死 循 环 ， 就 返回 ， 绪 束 该 吨 数 。 


可 以 看 到 ,这样 定义 的 函数 QOS 是 没有 问题 的 。 下 面 就 进入 关键 时 刻 了 : Q 这 个 
程序 作用 到 Q 日 映 的 编码 也 就 是 Q(Q) 上 会 不 会 发 生死 循环 呢 ? 当然 我 们 可 以 运用 强 
有 力 的 函数 P(Q,Q) 来 计算 这 个 问题 。 


假设 Q(Q) 会 发 生死 循环 ， 那 么 P(Q,Q) 束 会 返回 yes。 然 而 根据 Q 函数 的 定义 ， 
把 X=Q 代 入 其 中 , 会 发 现 由 于 P(Q,Q) 返 回 的 是 yes， 也 就 是 m=yes， 因 此 Q 图 数 会 马 
上 绪 束 ， 也 就 是 程序 Q(Q) 没 有 发 生死 循环 。 然 而 如 果 假 设 Q(Q) 不 会 发 生死 循环 ， 那 
么 P(Q,Q) 应 该 返回 no， 这 样 根据 Q 水 数 的 定义 ， 把 X=Q 代入 Q(Q) 会 得 到 m=no， 这 
样 程序 就 会 进入 do while 循环 ， 而 这 个 循环 显然 是 一 个 死 循环 ， 因 而 Q(Q) 发 生 了 死 
循环 。 这 又 导 臻 了 矛盾 。 

无 论 Q(Q) 会 不 会 发 生死 循环 ， 痢 会 产生 矛盾 ， 人 然而 哪里 错 了 呢 ? 答 采 只 能 是 
开始 的 前 提 就 错 了 , 也 就 是 说 , 我 们 最 开始 的 假设 P(X,Y) 能 够 判断 任意 程序 XX 在 输 
Y 的 时 候 是 否 死 循环 是 错误 的 ， 这 样 的 程序 P(X,Y) 不 存在 。 


> 法 


如 何 理 解 


也 许 你 会 感觉 整个 论证 过 程 有 些 怪 异 , 为 什么 不 存在 这 种 PCX,Y) 程 序 呢 ? 而 且 在 
上 面 的 论证 过 程 中 仅 仪 说 当 P(X, 了 作用 到 P(Q,Q) 上 时 会 产生 矛盾 , 似乎 并 不 能 说 明了 
作用 到 其 他 程序 上 不 能 判断 是 否 发 生死 循环 。 比 如 可 以 考虑 编写 这 样 一 段 程序 ,一 发 
现 某 个 程序 中 有 do while(T)〈 这 里 T 总 是 为 true ) 这 样 的 语句 就 判断 这 个 程序 会 有 
死 循环 。 这 显然 是 可 能 的 。 但 问题 的 关键 是 , 你 假设 了 P(X,Y) 能 够 判断 任意 一 个 程序 
是 否 发 生死 循环 ,问题 的 关键 就 在 于 “任意 程序 ”, 因 为 假如 你 根据 判断 是 否 有 do while(T) 
语句 的 方法 写 出 了 一 个 程序 P 来 判断 某 程序 是 否 发 生死 循环 , 那么 我 就 会 根据 你 这 个 
程序 了 再 构造 出 一 个 程序 Q, 就 是 利用 前 面 提 到 的 论证 方法 , 我 们 不 妨 瑟 成 Qp (这 里 
下 标 P 了 的 含义 表示 根据 你 的 程序 了 构造 的 Q )。 这 样 你 的 了 在 直到 P(Q,Q) 这 样 的 怪 东 
西 的 时 候 就 无 能 为 力 了 。 


可 能 你 还 不 服输 ， 于 是 你 又 改进 了 你 的 程序 变 成 了 P', 这 个 时 候 了 能 够 判断 包含 
了 Qe 这 个 程序 的 所 有 程序 情况 了。 那么 我 又 会 根据 你 的 新 程序 了 物 造 出 一 个 更 新 的 
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Qp'"， 你 的 程序 P' 仍 然 不 能 判断 ， 当 然 你 还 可 以 构造 P"P……， 我 也 会 跟 春 构造 
QpoQe…， 总 而 言 之 这 个 过 程 是 无 穷 的 。 因 为 我 总 在 你 之 后 构造 程序 ， 所 以 你 是 水 
我 是 船 ， 水 涨 山高 ， 我 总 能 比 你 局 一 级 别 。 

这 很 像 刚 开始 客 述 的 那个 猪 便 币 的 游戏 。 你 想 猿 对 我 的 人 硬币， 就 必须 告诉 我 你 的 
答案 是 左手 还 是 右手 ， 然 而 问题 是 我 总 能 根据 你 给 出 的 答案 进行 动态 调整 ， 让 你 永远 
也 猜 不 对 ! 停机 问题 也 是 如 此 , 我 总 能 根据 你 的 程序 P 来 构造 了 判定 不 出 来 的 问题 Q， 
我 总 会 属 ! 很 简单 ， 因 为 你 总 要 在 我 之 前 构造 好 P， 束 相当 于 你 总 要 和 完 说 出 便 币 在 哪 
< 


意味 着 什么 


我 们 已 经 看 到 了 ， 的 确 存在 春 一 些 我 们 人 类 能 构造 出 来 而 图 灵机 不 能 解 的 问题 。 
我 们 知道 图 灵机 不 能 解 的 问题 也 就 是 一 切 计算 机 神 不 能 解 的 问题 , 因而 这 类 问题 是 不 
可 计算 的 。 因 此 ， 必 然 存 在 看 计算 机 的 极限 。 实 际 上 ， 根据 我 们 前 面 用 述 的 计算 等 价 
性 原理 ， 很 多 问题 都 可 以 被 归结 为 图 灵 停 机 问题 ， 也 就 是 说 图 灵 俘 机 问题 揭示 了 宇宙 
中 的 某 种 共性 , 所 有 计算 机 不 能 解决 的 问题 从 本 质 上 讲 都 和 图 灵 停 机 问题 是 计算 等 价 
的 。 比 如 在 最 开始 我 们 提 到 的 硕 尔 伯 特 第 十 问题 ， 就 是 一 个 典型 的 不 可 计算 问题 。 还 
有 很 多 问题 是 不 可 计算 的 , 尤其 是 那些 涉及 计算 所 有 程序 的 程序 。 比 如 是 否 存在 一 个 
程序 能 够 检查 所 有 的 计算 机 程序 会 不 会 出 错 ， 这 是 一 个 非常 实际 的 问题 ， 然 而 这 样 的 
程序 仍然 是 不 存在 的 ， 其 实 可 以 证 明 这 个 问题 和 图 灵 俘 机 问题 实质 上 是 一 样 的 。 于 是 
我 们 的 梦想 又 破灭 了 。 


图 灵 集 机 问题 也 和 复杂 系统 的 不 可 预测 性 有 关 。 我 们 总 和 希望 能 够 预测 出 复杂 系统 
的 运行 结 末 。 那 么 能 不 能 发 明 一 种 聪明 的 程序 ， 输 入 某 个 复杂 系统 的 规则 ， 输 出 的 是 
这 些 规 则 运行 的 结果 呢 ?” 从 原则 上 讲 ， 这 种 事情 是 不 可 能 的 。 它 也 和 图 灵 集 机 问题 
等 价 。 因 而 ， 我 们 得 出 来 的 结论 就 是 : 要 想 弄 浓 楚 某 个 复 洒 系统 运行 的 结果 ， 唯 一 的 
办 法 就 是 让 这 样 的 系统 实际 运作 ,没有 任何 一 种 计算 机 算法 能 够 事先 给 出 这 个 系统 
的 运行 结果 。 但 这 并 不 是 说 不 存在 一 个 特定 的 程序 能 够 预测 某 个 或 者 某 类 复杂 系统 
的 结 朱 。 那 么 这 种 特定 的 程序 怎么 得 到 呢 ? 显然 需要 我 们 人 为 地 纺 程 得 到 。 也 就 是 说 
存在 着 菏 些 机 各 做 不 了 而 人 能 做 的 事情 。 这 对 人 工 知 能 的 扶 拜 者 来 说 似乎 是 沉重 的 
打击 % 


人 工 贸 能 真 的 是 不 可 能 的 吗 ? 绢 罗斯 曾经 写 过 一 本 科普 名 阁 《 呈 和 带 新 脑 》 来 论证 
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我 们 总 是 能 够 发 现 一 个 程序 是 否 有 和 死 循 环 ， 总 是 能 够 找到 对 某 类 复杂 系统 预测 的 方 
法 ,并 且 我 们 还 能 构造 出 图 灵 停 机 这 样 的 问题 。 然 而 事实 并 没有 那么 简单 ， 反 对 者 马 
上 就 会 论证 到 ， 其 实 针对 某 一 个 具体 的 人 ， 比 如 说 芯 罗 斯 ， 我 们 也 能 够 运用 前 面 的 方 
法 构造 出 一 个 绢 罗斯 日 己 不 能 解 的 问题 。 然 而 事实 上 要 构造 尺 罗 斯 不 可 解 的 问题 太 抹 
烦 了 ,而 我 们 只 是 说 原则 上 讲 这 种 问题 是 存在 的 。 因 而 计算 机 超越 不 了 的 问题 ， 人 自 
己 也 超越 不 了 ， 所 以 说 人 工 智能 是 可 能 的 。 

上 面 提 到 的 两 方面 论证 似乎 都 很 有 道理 , 究竟 哪个 正确 呢 ? 真 的 存在 某 个 人 类 不 
可 解 的 类 似 图 录 集 机 的 问题 吗 ?” 其 实 要 想 彻 抵 回 答 这 个 问题 就 相当 于 问 超越 图 录 计 
算 的 限制 是 否 可 能 。 如 何 超越 图 灵 停 机 问题 呢 ? 下 面 我 们 将 话 细 讨论 这 个 问题 。 


超越 图 灵 计 算 * 
我 们 仍然 以 那个 猜 硬 币 的 游戏 为 例 来 说 明 。 


在 进行 了 儿 轮 猿人 硬币 的 游戏 之 后 ， 你 已 经 很 恼火 了 ,认为 这 样 的 游戏 不 公平 。 于 
是 你 想 了 一 个 妙招 来 对 付 我 : 每 当 我 让 你 说 硬币 在 哪 只 手中 时 , 你 先 衣 乱 说 一 个 答案 ， 
比如 左手 。 于 是 我 会 根据 你 的 答案 进行 动态 调整 ， 把 便 币 放 到 了 右手 中 。 这 个 时 候 你 
赶 崇 抢 痢 说 : 不 对 ,我 猜 你 的 便 币 在 右手 ! 我 没 办 法 只 能 再 次 调整 策略 把 便 币 放 到 了 
在于 机 久 寻 快 二 时 作证 就 是 这 样 ， 你 也 学 会 了 我 的 方法 ,根据 我 的 于 
略 不 断 调 整 你 的 梨 略 从 而 让 我 不 可 能 慑 你 。 能 不 能 把 这 种 方法 用 到 超越 图 灵 停 机 问题 
呢 ? 


前 面 我 们 已 经 看 到 了 类 似 这 样 的 过 程 。 如 你 写 出 了 一 个 程序 P 能 够 判断 所 有 程序 
是 否 停机 ， 那么 我 就 能 构造 一 个 你 的 程序 判断 不 了 的 程序 Q。 这 时 你 又 根据 我 的 程序 
Q 构造 了 新 的 程序 P', 然 而 我 又 能 构造 一 个 程序 Q'， 仍 然 让 你 的 程序 P 浏 断 不 了 。 但 
是 你 没有 结束 ， 又 构造 了 新 的 程序 P"， 于 是 我 又 构造 了 Q”…… 


乍 一 看 ， 似 乎 这 个 过 程 并 不 能 资 明 任何 问题 。 原 因 很 测 单 ， 我 要 求 的 是 构造 一 个 
固定 的 程序 了 判断 出 所 有 程序 是 否 集 机 ,而 你 给 我 的 并 不 是 一 个 具体 的 实 实 在 在 的 程 
序 ， 而 是 一 个 不 断 变化 、 捉 挽 不 定 、 虚 无 吻 渺 的 程序 序列 ， 并 且 你 的 这 些 总 在 变化 的 
程序 序列 总 是 要 根据 我 构造 的 程序 才 会 确定 改变 。 
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首先 值得 肯定 的 一 点 是 ,运用 这 种 方法 ， 你 的 确 能 够 超越 图 灵 计 算 了 ， 只 要 反复 
不 停 地 变换 你 的 程序 ， 就 不 可 能 找 出 它 不 能 解 的 问题 。 然 而 ， 万 一 方面 又 会 让 我 们 很 
失望 : 这 样 的 变换 过 程 并 不 能 给 出 一 个 实 实在 在 的 程序 来 。 我 们 拥有 的 仅仅 是 不 断 改 
变 的 程序 序列 ， 而 不 是 一 个 实际 存在 的 程序 。 


这 正 是 问题 的 关键 所 在 : 要 想 彻底 超越 图 灵 计 算 的 限制 , 我 们 必须 放弃 程序 的 实 
在 性 。 也 就 是 说 程序 每 时 每 刻 都 要 变化 。 那 么 这 样 一 个 不 断 变 化 得 不 是 它 目 己 的 怪 东 
西 存在 吗 ? 


儿 千 年 的 人 类 科学 一 二 在 人 研究 实 实在 在 的 东西 。 无 论 是 原子 、 分 子 还 是 计算 机 程 
序 ， 它 们 必须 是 一 个 实 实在 在 存在 的 个 体 ， 在 这 种 前 提 下 科学 才能 够 对 它 进行 研究 。 
如 打 当 我 们 研究 它 的 时 候 ， 它 已 经 变 得 不 是 它 目 己 了 ， 那 么 科学 就 对 它 无 能 为 力 了 。 
然而 ， 我 不 茶 要 提出 这 样 的 问题 : 真 的 一 切 都 是 回 定 不 变 地 存在 春 的 吗 ? 有 没有 某 种 
东西 在 每 一 时 刻 都 在 变 得 不 是 它 目 己 呢 ? 


这 似乎 是 一 个 古老 的 哲学 问题 了。 记得 赫 拉 克利 特 就 几经 提 到 过 : 一 个 人 不 能 
次 踏 入 同一 条 河流 。 我 想 他 说 的 正 是 这 样 的 问题 : 因为 河流 在 每 时 每 刻 都 不 再 是 它 目 
己 了 。 河流 是 一 大 群 流动 的 水 滴 构 成 的 整体 ， 这 些 水 滴 每 时 每 刻 都 在 不 俘 地 运动 、 流 
逝 ， 因 而 当 你 两 次 踏 人 这 条 河 的 时 候 ， 所 有 的 水 滴 可 能 都 不 一 样 了 ， 那 么 我 们 怎么 能 
说 这 些 水 滴 构 成 的 整体 还 是 同一 条 河 呢 ? 


再 考虑 我 们 人 自己 。 你 很 可 能 拿 着 一 个 3 岁 时 的 照片 兴奋 地 对 你 的 朋友 说 :“ 看 ， 
我 3 岁 的 时 候 多 可 爱 呀 !” 人 然而 你 这 人 句 话 意 味 着 什么 呢 ?” 意 味 着 照片 反映 的 3 岁 的 你 
和 现在 的 你 是 同一 个 个 体 。 然 而 ，3 岁 的 你 和 现在 的 你 是 多 么 不 同 呀 ! 我 们 知道 ， 你 
无 疑 就 是 一 大 堆 细胞 构成 的 整体 。 而 基本 生理 学 知识 告诉 我 们 ， 人体 的 所 有 细胞 每 隔 
大 约 4 年 就 会 因为 新 陈 代谢 的 作用 全 部 更 新 一 遍 , 也 就 是 说 , 你 的 细胞 全 被 调包 了 ， 
更 何况 3 岁 的 你 和 现在 的 你 差 了 多 少 个 4 年 呀 ? 那 赁 什么 说 那个 3 岁 的 你 就 是 现在 的 
你 呢 ? 


这 个 问题 看 似 系 学 , 不 过 我 认为 现在 我 们 的 硝 应 该 认真 对 符 该 问题 了 。 尽 管 从 分 
析 的 角度 来 说 ，3 岁 的 你 和 现在 的 你 的 确 不 是 一 个 个 体 ， 然 而 稼 识 告诉 我 们 ， 这 两 个 
你 的 确 都 是 同一 个 人 。 那 就 意味 着 ， 你 这 个 个 体 并 不 是 一 些 一 成 不 变 的 固定 的 细胞 ， 
而 是 一 个 每 时 每 刻 都 在 变化 和 更 新 的 一 大 堆 细 胞 组 成 的 构 形 。 这 个 构 形 在 每 时 每 刻 都 
要 利用 更 新 的 一 大 堆 细 胞 去 维持 日 己 的 存在 。 和 我 们 前 面 叙 述 的 超越 图 灵机 的 讨论 绪 
合 起 来 丈 会 发 现 ， 人 和 赫 拉 元 利 符 的 河流 这 种 东西 刚好 就 满足 超越 图 录 计 算 的 要 求 。 
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也 就 是 说 人 和 赫 拉 克利 符 的 河流 在 每 时 每 刻 都 在 不 停 地 更 新 日 己 从 而 变 得 不 是 它 目 
己 了 。 那 么 很 有 可 能 ， 某 一 种 做 类 似 变 化 的 个 体 的 变化 规律 就 是 不 停 超越 它 自 己 的 图 
灵 停 机 程序 ， 这 样 的 虚 弥 的 个 体 就 真 的 能 够 超越 图 灵 计 算 了 。 


总 结 前 面 的 讨论 ,我 们 不 难得 出 结论 ,一 个 写 出 就 不 再 变化 的 固 死 的 程序 不 可 能 
超越 图 灵 计 算 的 限制 ， 然 而 如 果 一 个 程序 每 时 每 刻 都 变化 得 不 是 它 目 己 了 ,那么 这 个 
程序 束 能 够 超越 图 录 计 算 。 联 系 到 人 这 个 个 体 ， 我 们 束 能 得 到 : 因为 每 时 每 刻 的 人 都 
已 经 由 于 细胞 的 变化 而 变 得 不 再 是 它 自己 了 ， 所 以 人 是 超越 图 灵 计 算 的 。 还 记得 我 在 
前 面 提 到 的 一 个 问题 吗 : 人 脑 的 信息 处 理 过 程 能 不 能 被 表示 成 固定 的 程序 呢 ? 我 这 里 
的 答案 就 是 否定 的 ， 也 就 是 说 人 脑 信 息 处 理 的 过 程 并 不 是 一 个 固定 的 程序 。 如 何 制造 
真正 的 人 工 智能 呢 ? 我们 的 谷 案 就 是 : 一 个 能 不 断 改 变 目 己 的 程序 , 而且 这 种 改变 也 
不 是 一 个 固定 的 程序 。 


关于 计算 理论 有 很 多 值得 参考 的 教科 书 , 例如 《计算 理论 守 引 》， 以 及 比较 全 面 的 
Elements of the Theory of Computation。 男 外 一 本 比较 通俗 的 是 Computability: An 
Jntroduction to Recursive Function Theory， 作 者 用 一 种 图 灵机 的 变种 来 介绍 计算 理论 中 
的 各 种 概念 。 关 于 图 灵 的 生平 ， 可 以 参看 《 艾 伦 ' 图 灵 传 六 想 要 了 解 方 塔 纳 关 于 图 灵 
气 的 试验 ， 可 以 参考 4legorithmic Chemistry 一 文 。 
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第 3 莹 ”从 零 开 始 的 计算 机 系统 


曾经 的 孩 担 时代， 很 多 人 对 于 机 械 的 力量 都 充满 了 好 奇 ， 对 于 一 切 新 奇 的 玩意 ， 
总 有 一 种 想 拆 开 来 看 看 的 欲望 。 有 时 会 不 小 心 修好 ,但 有 时 拆 完 以 后 闭 回 去 部 发 现 多 
了 好 几 个 零件 。 无 论 如 何 ， 那 些 探 索 过 的 生活 是 羊 福 的 。 今 天 ， 你 还 有 上 再 次 动手 造 个 
玩具 的 愿望 中? 你 想 过 日 己 动 手 造 个 计算 机 吗 ? 


提 到 造 计算 机 , 很 多 人 的 第 一 反应 就 是 身 穿 全 密封 的 太空 服 , 在 无 侍 车 间 里 或 者 
长 长 的 生产 线 上 ,各 种 各 样 的 零件 被 竣 到 一 全 人 台 机 箱 里 面 的 生产 场景 。 其 实 台 像 造 一 
台 汽 车 一 样 ， 无 论 是 工厂 里 面 密 密 麻 麻 的 制造 闻 配 线 ， 还 是 给 小 孩 玩 的 桔梗 ， 制 造 原 
理 本 质 上 都 差不多 。 我 们 虽然 没有 条 件 造 一 全 功能 强大 的 计算 机 ， 但 完全 有 可 能 构造 
一 个 属于 目 己 的 计算 机 系统 。 下 面 我 们 就 讲述 如 何 从 基本 的 逻辑 门 开始 构造 一 个 计算 
机 系统 模型 。 


从 三 体 开始 一 一 逻辑 门 


刘 慈 欣 在 科幻 名 著 《 三 体 》 中 曾经 描述 了 这 样 一 个 情节 为 了 预测 和 计算 神奇 的 
三 体 世 界 中 三 个 太阳 的 运行 轨迹 ， 牛顿 和 冯 . 诺 依 曼 找到 秦始皇 ， 希 望 借 他 的 三 千 万 
大 军 来 制造 一 台 计算 机 。 


“ 腾 当 然 需要 预测 太阳 的 运行 ， 但 你 们 让 我 集结 三 千 万 大 军 ， 至 少 要 首 
先 向 腾 演 示 一 下 这 种 计算 如 何 进 行 吧 。 
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“我 不 知道 你 们 的 名 字 ,” 冯 ， 诺 依 曼 拍 拍 前 两 个 士兵 的 悄 ,，“ 你 们 两 个 
负责 信号 输入 ,就 叫 “ 入 1 ”“ 入 2” 吧 ,” 他 又 指 指 最 后 一 名 士兵 : “你 ， 负 
责 信号 输出 ， 就 叫 “ 出 ” 吧 。 他 伸手 拨 动 三 名 士兵 :“ 这 样 ， 站 成 一 个 三 角 
形 ， 出 是 顶端 ， 入 1 和 入 2 是 拱 边 。 
牛顿 不 知 从 什么 地 方 掏 出 六 面 小 旗 ， 三 白 三 黑 ， 冯 ， 诺 依 曼 接 过 来 分 给 
三 名 士兵 , 每 人 一 白 一 黑 , 说 :“ 和 白色 代表 0, 黑色 代表 1。 好, 现在 听 我 说 ， 
出 ， 你 转身 看 着 入 1 和 入 2， 如 果 他 们 都 举 黑 旗 ， 你 就 举 黑 旗 ， 其 他 的 情况 
你 都 举 和 白旗 ， 这 种 情况 有 三 种 一 一 入 1 白 ， 入 2 黑 ; 入 1 黑 ， 入 2 和 白 ; 入 |]1、 
入 2 都 是 白 。” 

兴奋 中 的 冯 ，. 诺 依 曼 没 有 理 皮 皇 常 ， 对 三 名 士兵 大 声 命令 :“ 现 在 开始 
运行 ! 入 1 入 2， 你 们 每 人 随意 举 旗 ， 好 ， 举 ! 好， 再 举 ! 举 1” 

入 1 和 入 2 同时 举 了 三 次 旗 ， 第 一 次 是 黑 黑 ， 第 二 次 是 和 白 黑 ， 第 三 次 是 
黑白 。 出 都 进行 了 正确 反应 ， 分 别 举 起 了 一 次 黑 和 两 次 白 。 

“很 好 ， 运 行 正确 ， 陛 下 ， 您 的 士兵 很 聪明 1” 

“这 事 儿 傻瓜 都 会 ， 你 能 告诉 联 ， 他 们 在 干什么 吗 ? ”秦始皇 一 脸 困惑 
地 问 。 

“这 三 个 人 组 成 了 一 个 计算 系统 的 部 件 ， 是 门 部 件 的 一 种 ， 叫 “与 门 "。 
冯 ，. 诺 依 曼 说 完 停 了 一 会 儿 ， 好 让 皇帝 理解 。 

了 始 皇 面 无 表情 地 说 :“ 联 是 够 郁 间 的， 好 ， 继 续 。” 冯 ， 诺 依 曼 转 向 排 
成 三 角 阵 的 三 名 士兵 : “我们 构造 下 一 个 部 件 。 你， 出 ， 只 要 看 到 入 1 和 入 2 
中 有 一 个 人 举 黑 旗 ， 你 就 举 黑 旗 ， 这 种 情况 有 三 种 组 合 一 一 黑 黑 、 和 白 黑 、 黑 
白 ,， 剩 下 的 一 种 情况 一 一 白白 , 你 就 举 白 旗 。 明白 了 吗 ? 好 和 孩子， 你 真 聪明 ， 
门 部 件 的 正确 运行 你 是 关键 ,好 好 干 ,皇帝 会 奖赏 你 的 ! 下 面 开 始 运 行 ! 举 ! 
好 ， 再 举 ! 再 举 ! 好 极 了 ， 运 行 正常 ， 陛 下 ， 这 个 门 部 件 叫 或 门 。” 

然后 ， 冯 ， 诺 依 曼 又 用 三 名 士兵 构造 了 与 非 门 、 或 非 门 、 开 或 门 、 同 或 
门 和 三 态 门 ， 最 后 只 用 两 名 士兵 构造 了 最 简单 的 非 门 ， 出 总 是 举 与 入 颜色 相 
反 的 旗 。 

站 “' 诺 依 曼 对 皇帝 鞠躬 说 :“ 现 在 ， 陛 下 ， 所 有 的 门 部 件 都 已 演示 完毕 ， 
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这 很 简单 不 是 吗 ? 任何 三 名 士兵 经 过 一 小 时 的 训练 就 可 以 掌握 。” 

“他 们 不 需要 学 更 多 的 东西 了 吗 ? ”秦始皇 问 。 

“不 需要 ， 我 们 组 建 一 千 万 个 这 样 的 门 部 件 ， 再 将 这 些 部 件 组 合成 一 个 
系统 ， 这 个 系统 就 能 进行 我 们 所 需要 的 运算 ， 解 出 那些 预测 太阳 运行 的 微分 
方程 。 这 个 系统 ， 我 们 把 它 叫 作 :……: 咽 ， 叫 作 .……: 下 

“计算 机 。” 


这 段 故 事 提 到 的 一 千 万 个 这 样 的 门 部 件 , 就 是 搭建 计算 机 的 基础 元 件 , 叫 逻 辑 门 ， 
用 于 完成 逻辑 运算 。 逻 辑 运 算 又 称 布尔 运算 ， 无 论 是 输入 还 是 输出 ， 痢 上 只 有 0 和 1， 
用 来 表示 两 个 对 立 的 逻辑 状态 。 用 来 执行 与 、 或 、 非 这 三 种 最 基本 导 辑 运算 的 元 件 称 
为 与 门 、 或 门 、 非 门 。 在 图 3-1 至 图 3-3 中 ， 左 侧 是 输入 的 信号 ， 右 侧 是 输出 的 信号， 
对 于 逻辑 门 元 件 来 说 ， 必 须 有 输入 和 输出 ， 可 以 是 一 对 一 ， 也 可 以 是 多 对 多 。 


与 门 执行 的 是 “与 ”的 操作 ， 如 图 3-1 所 示 ， 两 个 输入 信号 和 一 个 输出 ， 对 于 两 
个 输入 xX 和 y， 只 有 x 与 y 都 为 1 时， 输出 才 为 1。 


3-1 与 门 


或 门 执行 的 是 “或 ”的 操作 ， 如 图 3-2 所 示 ， 两 个 输入 信号 和 一 个 输出 ， 对 于 两 
个 输入 x 和 y， 当 x 或 y 只 要 其 中 一 个 为 1 时 , 输出 就 为 1。 和 与 门 的 图 标 相 比 ， 左 边 
的 输入 线 是 弯 的 。 


3-2 或 门 
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非 门 执行 的 是 “ 非 ” 的 操作 ， 如 图 3-3 所 示 ， 一 个 输入 信号 和 一 个 输出 ， 对 于 输 
入 的 数据 ， 取 该 数据 的 对 立 数 据 。 有 的 时 候 也 可 以 耳 接 在 或 门 或 者 与 门 的 输入 问 加 一 
个 小 圆圈 表示 对 该 点 的 输入 取 非 。 


3-3 非 门 


使 用 这 三 种 基本 的 逻辑 门 ， 就 可 以 实现 所 有 的 逻辑 运算 ， 进 而 构造 出 一 整套 的 计 
算 。 计 算 机 的 本 质 就 是 上 述 提 到 的 与 门 、 或 门 、 非 门 等 各 种 门 ， 只 要 实现 了 类 似 士 兵 
举 黑 白旗 子 的 功能 ， 木 头 、 水 条 、 塑 料 、 卡 子 ， 只 要 能 够 完成 基本 逻辑 门 的 功能 ,， 任 
何 东西 都 能 够 做 成 计算 机 。 


计算 机 界 易 易 有 名 的 科学 家 丹尼尔 硕 利 斯 (Daniel Hills ) 在 上 中 学 的 时 候 ， 
用 木头 和 弹 短 制造 了 一 台 计 算 机 (如 图 3-4 所 示 )。 


丹尼尔 : 希 利 斯 连结 机 器 
( Connection Machine ) 的 首要 设 
计 者 ， 他 设想 通过 一 种 币 有 数 百 
万 个 计算 处 理 器 的 大 规模 并 行 计 
算 机 模拟 大 脑 的 组 织 和 运行 机 
制 。 他 从 童年 时 就 对 生物 学 和 工 
程 学 非常 感 兴 趣 ， 很 小 的 时 候 就 
开始 玩 模型 和 积木 玩具 ， 。 
模型 和 玩具 研究 引擎 和 机 器 


了 : 
be pi vy, 


lm. en 
he 建议 下 ， 创 办 了 思维 机 器 公司 

了 (Thinking Machines )， 开 始 进行 

3-4 丹尼尔: 希 利 斯 的 积木 计算 机 连接 机 器 的 实际 制作 。 目 前 各 类 


机 器 主要 用 于 数据 库 搜 索 、 地 球 物理 建 模 、 蛋 白质 折 党 、 气 候 模 拟 等 方面 。 


这 全 计算机 实现 与 、 或 、 非 的 操作 都 是 靠 木 杆 和 弹 筑 来 实现 的 ( 如 图 3-5 至 图 3-7 
所 示 )。 在 这 个 系统 里 面 ， 木 头 往 前 推 即 为 1， 往 回 拉 即 为 0。 以 或 门 为 例 ， 只 要 4 和 
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B 中 有 一 个 有 推力 ， 输 出 就 会 有 推动 ， 这 个 推动 可 以 作为 输入 再 传递 到 下 一 个 门 ， 整 
个 计算 机 系统 就 是 由 这 些 门 组 成 的 。 


输出 


图 3-5” 木 杆 和 弹簧 实现 的 非 门 


re 2 | 
tc | » 
输入 4 
ee 
oT 
一 一 一 > 
输入 B 


3-6 ” 木 杆 和 弹簧 实现 的 或 门 


3-7” 木 杆 和 弹簧 实现 的 与 门 
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目前 除了 现代 电脑 以 外 ,市 面 上 几乎 没有 其 他 计算 机 系统 ， 其实 是 因为 除了 工业 
集成 电路 技术 ， 疝 没有 别 的 更 好 的 技术 ， 能 够 将 上 述 逻 辑 门 以 千 万 级 的 数量 集成 在 一 
个 几 厘 米 见 方 的 世族 里 面 ， 从 而 实现 商业 化 的 规模 生产 和 应 用 。 未 来 随 春 纳米 技 术 和 
分 子 生物 技术 的 进步 ， 一 定 会 有 别 的 形式 的 商业 级 计算 机 出 现 。 


一 切 运 算 的 基础 一 一 加 法 


或 许 你 会 怀疑 上 述 倘 单 的 逻辑 门 能 够 做 什么 事情 ， 接 下 来 我 们 将 会 看 到 ,通过 组 
合 ， 逻 辑 门 就 能 实现 基本 的 计算 功能 。 

与 我 们 平 笛 文 持 0 到 9 的 十 进 制 计算 不 同 。 因 为 整个 计算 机 系统 只 有 0 和 1 两 个 
数 ， 所 以 这 样 的 计算 机 系统 只 能 够 文 持 0 和 1 的 二 进 制 计算 ， 在 计算 机 系统 里 面 ， 所 
有 的 计算 部 知 要 转换 成 二 进 制 。 十 进 制 与 二 进 制 的 对 应 转换 关系 如 表 3-1 所 示 。 


表 3-1 十 进 制 与 二 进 制 对 应 转换 关系 示例 


十 进 制 | 二 进 制 
0 000 
] 001 
2 010 
3 011 
4 100 
5 101 
6 110 
7 111 


举 个 简单 的 例子 ， 比 如 实现 2+3=5 这 样 的 计算 ， 在 二进制 加 法 中 规则 是 ， 1 和 
0 相 加 得 1，1 和 1 相 加 需要 往 前 进 一 位 ， 得 10。 二 进 制 和 十 进 制 的 基本 操作 过 程 是 
一 样 的 ， 如 图 3-8 所 示 。 


3-8 2+3 的 二 进 制 计算 示例 
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为 了 实现 上 述 计算 功能 ， 需 要 首先 实现 半 加 龙 ， 通 过 半 加 需 实 现 全 加 需 ， 再 通过 
三 个 全 加 妖 的 连接 ， 就 能 够 形成 支持 上 述 计算 的 一 个 三 位 加 法 器 了 。 

半 加 器 (Half Adder): 如 图 3-9 所 示 ， 对 于 给 定 的 输入 a 和 4b (它们 都 只 能 取 0 
或 者 1 )， 通过 一 个 或 门 、 两 个 与 门 、 一 个 非 门 (图 中 小 圆 点 ) 的 组 合 ， 可 以 对 两 个 位 
进行 加 法 并 形成 进位 。 半 加 需 的 输入 和 输出 过 程 见 表 3-2。 


和 ~0 
a EE 和 ~2 


3-9 ” 半 加 器 实现 示例 


表 3-2 半 加 器 的 输入 和 输出 


a b 进位 和 
0 0 0 0 
0 ] 0 ] 
] 0 0 ] 
] ] ] 0 


全 加 器 (Full Adder): 如 图 3-10 所 示 , 通过 两 个 半 加 需 和 一 个 或 门 的 组 合 , 形成 
了 一 个 全 加 需 。 与 半 加 器 相 比 ， 全 加 需 在 输入 上 多 了 一 个 接收 的 进位 ,可 以 把 从 低位 
进位 而 来 的 数据 纳入 到 计算 中 ， 将 从 低位 计算 产生 的 进位 也 加 在 一 起 。( 其 中 x、y 表 
示 两 数 相 加 ，c 表示 接收 低位 的 进位 )。 全 加 需 的 输入 和 输出 过 程 见 表 3-3。 


半 加 器 1 下 加 证 吧 进位 -0 


3-10 ”全 加 器 实现 示例 
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表 3-3 ”全 加 器 的 输入 和 输出 


X y C 进位 和 
0 0 0 0 0 
0 ] 0 0 ] 
] 0 0 0 ] 
] ] 0 ] 0 
0 0 ] 0 ] 
0 ] ] ] 0 
] 0 ] ] 0 
] ] ] ] ] 
三 位 加 法 顺 : 通 过 三 个 全 加 需 的 组 合 , 就 形成 了 一 个 三 位 加 法 需 ( 如 图 3-11 所 示 )。 


该 加 法 融 可 以 把 从 低位 相 加 产生 的 进位 依次 传递 到 高 位 , 可 以 实现 任意 三 位 的 二 进 制 
数 的 加 法 ， 即 可 以 实现 上 述 例子 中 的 计算 。 


金 加 铝 们 全 加 器 亿 


3-11 三 位 加 法 器 实现 示例 


以 此 类 推 , 为 了 实现 对 位 二 进 制 数据 的 加 法 ,需要 使 用 n 个 全 加 幽 蕊 片 ,并且 
依次 把 进位 传 到 下 一 个 全 加 带 。 同 理 ， 我 们 可 以 通过 任意 位 的 加 法 从 来 实现 对 于 较 长 
二 进 制 数 的 计算 。 尽 管 我 们 只 介绍 了 加 法 运算 的 实现 ， 实 际 上 数学 家 已 经 证 明 ， 加 法 
是 实现 所 有 数学 运算 的 基础 。 有 了 加 法 融 ， 原 则 上 如 能 通过 它们 搭建 任何 其 他 计算 ， 
像 乘 法 、 除 法 、 平 方 、 开 方 、 三 角 函 数 、 对 数 函 数 等 。 而 伟大 的 计算 机 科学 家 图 灵 在 
一 百年 前 就 已 经 指明 ， 这 些 简单 运算 足以 文 返 任 何 信息 处 理 过 程 。 


如 采 需 要 实现 上 述 加 法 器 , 最 直接 的 方法 是 采购 相应 逻辑 门 级 别 的 晶体 管 电子 元 
件 杀 目 动手 焊接 实现 。 图 3-12 中 是 通过 品 体 管 直 接连 线 实 现 的 一 个 8 位 的 加 法 需 ,， 下 
面 一 排 红 灯 表 示 的 是 两 个 输入 相 加 的 数据 00000111(7) 和 00000001(1)， 上 面 一 排 红 灯 
显示 的 是 计算 结果 00001000(8)。 

然而 随 着 设计 功能 的 复杂 化 , 通过 手动 连接 实现 将 会 面 对 大 量 的 品 体 管 和 海量 的 
复杂 连 线 ,因此 人 们 发 明了 FPGA ( Field-Programmable Gate Array ), 它 提 供 了 大 量 的 
基础 逻辑 元 件 ， 这 些 元 件 封装 在 一 个 小 的 芯片 里 面 ， 可 以 看 成 是 一 个 计算 芯片 的 半 成 
品 。 设 计 人 员 可 以 在 软件 中 以 类 似 于 编程 的 方式 设计 逻辑 元 件 的 连接 ， 并 将 其 写 和 人 到 


i 二 | sk 和 
面 而 | 一 而 市 十 本 3 到 和 j 1 


末 画 。 司 本 面 训 二 十 面 二 夯 画 二 十 本 本 下 大 看 用 


as 
一 
| = 


Pe 二 | 
村 计 | | 
本 ee I~ i ee 


图 3-12 ”8 位 加 法 器 实 侈 


| ( 男 见 彩 搬 ) 


这 种 专门 对 便 件 连接 进行 编程 的 语言 一 般 叫 硬件 描述 语言 ( Hardware Description 
Language )， 目 前 主要 有 两 种 ， 分 别 是 Verilog HDL 和 VHDL。 通 过 编写 HDL 代码 实 
现 了 功能 以 后 ， 可 以 通过 专门 的 仿真 软件 〈 商业 软件 如 Quarts ， 开 源 软 件 如 Icarus 
Verilog ) 将 其 烧 录 到 开发 板 中 去 实现 相应 的 功能 。 如 果 和 需要 动手 实现 的 话 ， 入 门 级 的 
FPGA 开发 板 大 概 三 四 百 元 就 可 以 搞定 ， 具 体 实 现 可 参考 “推荐 阅读 ”中 的 内 容 。 


0 


相 


让 计算 过 程 目 动 起 来 


事实 上 ， 人 天 生 就 是 懒 懈 的 ， 刚 刚 介绍 的 机 各 虽然 能 够 解决 基本 计算 的 问题 , 但 
征 说 实在 的 ， 确 实 非常 不 好 用 。 比 如 现在 需要 做 一 个 连续 加 的 操作 ， 假 设 我 们 硕 望 抑 
把 三 个 数字 加 在 一 起 , 然后 把 另外 两 个 数字 加 在 一 起 , 最 后 再 把 男 外 三 个 数 加 在 一 起 。 
如 采 使 用 前 面 的 机 各 ,我 们 需要 把 这 些 数字 都 号 在 纸 上 ， 然 后 按照 二 进 制 的 格式 一 个 
个 地 输入 进去 ， 并 根据 计算 结果 显示 的 情况 把 数据 抄 下 来 ,然后 再 继续 计算 。 在 这 个 
过 程 中 ， 震 要 不 断 地 把 数据 操作 过 程 在 计算 机 外 记录 下 来 , 那么 有 没有 办 法 让 计算 过 
程 目 动 进行 呢 ? 答案 是 肯定 的 。 


指令 


机 


了 
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站 和 完 ， 我 们 和 需要 一 种 叫 作 内 存 的 东西 ， 它 能 够 把 数据 存储 在 计算 机 里 面 ， 并 且 能 
够 保持 一 定 的 时 间 。 可 以 把 内 存 理解 为 一 个 一 个 的 小 房间 ， 每 个 小 房间 都 有 一 个 门牌 
写 ， 这 就 是 地 址 ， 地 址 表示 的 是 数据 存储 的 位 置 。 内 存 的 主要 作用 就 是 能 够 对 数据 进 
行 存储 、 读 取 和 修改 。 关 于 内 存 的 实现 ， 除 了 上 述 提 到 的 基本 逻辑 门 的 组 合 〈 组 合 逻 
辑 ) 以 外 ， 还 需要 加 上 触发 带 设 计 〈 涉 及 时 序 逻 辑 ) 实现 。 


图 3-13 所 示 是 一 个 在 内 存 中 计算 求 和 的 过 程 , 为 了 表示 方便 , 我 已 经 把 里 面 关 于 
二 进 制 的 表述 都 换 成 了 我 们 较为 熟悉 的 十 进 制 , 实际 上 在 计算 机 里 面 存储 的 都 是 二 进 
制 。 在 这 里 ， 每 一 个 格子 表示 一 个 内 存 地 址 单元 ,里面 存 放 的 是 相应 的 数据 ， 左 边 是 
这 些 内 存单 元 的 地 址 编号 , 基本 上 所 有 的 地 址 编号 都 是 从 0 开始 的 , 因此 图 3-13 表示 
的 是 在 内 存 的 第 0000 号 单元 格 中 存放 的 数据 是 27, 在 0001 号 单元 格 中 存放 的 数据 是 
12 ee 


0000 

第 一 个 和 放 这 里 
0004 

第 二 个 和 放 这 里 
0007 

第 三 个 和 放 这 里 


图 3-13 ”累加 求 和 在 内 存 中 的 实现 过 程 
为 了 完成 图 3-13 所 未 的 求 和 操作 ， 我 们 需要 进行 的 操作 如 下 : 


口 把 地 址 0000 中 的 数 读 取 到 加 法 带 中 (该 取 ) 
口 把 地 址 0001 中 的 数 加 到 加 法 硕 中 (加 ) 
口 把 地 址 0002 中 的 数 加 到 加 法 硕 中 (加 ) 
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口 把 加 法 融 中 的 数 保存 到 地 址 0003 中 (保存) 
口 把 地 址 0004 中 的 数 谈 取 到 加 法 硕 中 〈 访 取 ) 

口 把 地 址 0005 中 的 数 加 到 加 法 希 中 《加 ) 

口 把 加 法 絮 中 的 数 保 存 到 地 址 0006 中 (保存 ) 

口 把 地 址 0007 中 的 数 读 取 到 加 法 帮 中 ( 读 取 ) 

口 把 地 址 0008 中 的 数 加 到 加 法 希 中 《加 ) 

口 把 地 址 0009 中 的 数 加 到 加 法 希 中 《加 ) 

口 把 加 法 需 中 的 数 保存 到 地 址 00010 中 (保存 ) 
口 停止 加 法 需 的 自动 计算 工作 〈 售 止 ) 


我 们 需要 用 到 四 种 操作 : 该 取 、 加 、 保 存 、 停 止 。 假 如 我 们 想 让 计算 机 来 目 动 执 
行 这 四 种 操作 ， 可 以 将 这 几 种 操作 编码 成 数字 ， 如 表 3-4 所 示 。 


表 3-4 ”操作 编码 对 照 表 


操 ” 作 编 码 
Load(〈 读 取 ) 10 
Store( 保存 ) 11 
Add (加 ) 20 
Halt ( 信 止 ) 99 


这 样 编码 只 是 为 了 方便 ， 并 没有 特别 的 原因 。 通 过 相应 的 转换 以 后 ， 上 述 的 相应 
计算 操作 即 可 编码 成 如 图 3-14 所 示 的 操作 过 程 ， 存 放 在 以 1000 开始 的 内 存 地 址 中 。 


Load 
Add 
Add 
Store 
Load 
Add 
Store 
Load 
Add 
Add 
Store 
Halt 


1000 


1004 


一 | | 一 
局 一 1 一 1 二 1 二 | 一 


1007 


1010 


本 


3-14 ”编码 过 程 
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但 是 ,实际 上 这 样 的 编码 序列 还 是 无 法 目 动 运行 ， 因 为 前 面 的 每 个 操作 都 需要 指 
定 操作 数据 地 址 ,因此 ,假设 我 们 规定 每 个 操作 命令 加 上 操作 数据 的 地 址 为 三 个 内 存 
单元 ， 并 命名 为 指令 ， 那 么 整个 计算 过 程 的 编码 如 图 3-15 所 示 。 


1000 10 | Load 0000， 把 地 址 0000 中 的 数 读 取 到 加 法 器 中 


1003 Add 0001， 把 地 址 0001 中 的 数 加 到 加 法 器 中 
1006 Add 0002， 把 地 址 0002 中 的 数 加 到 加 法 器 中 
1009 Store 0003， 把 加 法 絮 中 的 数 保 存 到 地 址 90003 中 


停止 计算 


2 : TDI 一 |TSOIOITDOISOC|ICIO > 
* 。 全 一 NS 一 | 一 | 生 | 一 > 


3-15 ”整个 计算 过 程 的 编码 


这 样 计算 机 束 可 以 根据 存储 在 内 存 中 的 指令 一 条 条 地 往 下 执行 直到 遇 到 停机 指 
令 ,， 这 样 就 可 以 让 整个 计算 过 程 日 动 执行 ,从 而 让 计算 机 根据 写 好 的 指令 完成 我 们 想 
要 的 计算 了 。 


上 述 四 个 基本 指令 只 是 用 于 这 样 的 连续 累加 所 涉及 的 一 些 操 作 的 示意 , 真正 通用 
的 计算 机 在 进行 运算 时 , 需要 设计 更 多 的 便 件 来 实现 相应 更 多 的 指令 。 一 个 计算 机 系 
统 文 持 的 全 部 指令 称 为 指令 集 ， 在 对 计算 机 进行 设计 时 ， 有 两 种 基本 的 设计 思路 ， 一 
种 是 设计 精简 的 指令 集 , 复杂 的 计算 通过 编程 实现 。 比 如 可 以 设计 只 支持 加 减 运 算 的 
令 集 ， 那 么 对 于 乘法 的 实现 ,就 可 以 通过 在 软件 中 不 断 地 用 加 法 来 实现 。 这 种 必 
设计 简单 , 适用 范围 广泛 。 为 一 种 是 设计 复 森 的 指令 集 , 如 直接 通过 便 件 来 实现 乘法 ， 
可 以 实现 更 快 的 运算 速度 ， 同 时 也 增加 了 便 件 设计 的 复杂 性 和 成 本 。 
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在 实际 的 硬件 设计 时 ， 由 于 在 计算 过 程 中 经 常会 对 一 些 常用 的 数 进行 操作 ， 于 是 
专门 设置 了 一 种 叫 作 寄 存 器 的 东西 (例如 在 上 述 操作 中 ， 加 法 器 计算 的 结果 我 们 默认 
保存 在 加 法 右 中 ， 实 际 上 一 般 CPU 计算 完 的 结果 都 在 寄存 器 中 )， 专 门 用 于 对 需要 中 
转 的 数据 进行 暂 存 ， 类 似 于 平常 运算 过 程 中 用 到 的 可 擦 写 的 草稿 纸 。 

以 英特尔 早年 的 一 款 CPU 8080 为 例 ， 它 的 设计 中 一 共有 A、B、C、D、E、H.、 
L 七 个 寄存 器 ， 光 是 对 数据 进行 复制 的 操作 就 有 好 几 十 条 操作 指令 (操作 码 ), 部 分 操 
作 指 令 如 图 3-16 所 示 。 


操作 码 操作 码 


40 
41 
42 
43 
44 
45 
46 
47 
48 
49 
4A 
4B 
4C 
4D 
4E 
4F 5H 


30 
| 
2 
33 
34 
53 
30 
37 
38 
39 
SA 
3B 
SC 
5D 
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,前 
;0 
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-和 
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和 
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六 
| 
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图 3-16 数据 复制 操作 指令 


其 中 左边 一 列 是 操作 人 码 ， 是 用 十 六 进 制 表示 的 ,右边 对 应 的 是 把 数据 从 一 个 寄存 
右 复 制 到 男 一 个 寄存 器 的 操作 (按理 说 move 应 该 是 把 原来 的 数 拿 到 另 一 个 地 方 ， 但 
这 里 实际 的 意思 是 copy， 真 不 知道 当初 设计 的 人 是 怎么 命名 的 ) 


图 3-17 所 示 是 加 法 和 减法 的 操作 码 ， 其 中 ADD 是 加 法 ，ADC 是 带 进 位 的 加 法 ， 
SUB 是 减法 ，SBB 是 带 借 位 减法 。 
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操作 码 外 令 操作 码 ES 
80 ADDA， 90 SUBA， 
81 ADDA， 91 SUBA， 
82 ADDA， 92 SUBA， 
83 ADDA， 93 SUBA， 
84 ADDA， 94 SUBA， 
8> ADDA， 95 SUBA， 
86 ADDA， 96 SUBA， 
87 ADDA， 97 SUBA， 
88 ADDA， 98 SUBA， 
89 ADDA， 99 SUBA， 
8A ADDA， 9A SUBA， 
8B ADDA， 9B SUBA， 
8C ADDA， 9C SUBA， 
8D ADDA, L 9D SUBA， 
8E ADDA, [HL] SUBA , [HL] 
SF ADDA，A 9F SUBA，A 


图 3-17 ”数据 加 减 的 操作 指令 


从 上 述 操作 码 的 编码 来 看 ， 只 要 你 在 设计 时 规定 了 并 按照 一 定 的 顺序 实现 以 后 ， 
那么 按照 左边 的 操作 码 就 可 以 进行 相应 的 计算 了 。 


使 用 方式 如 图 3-18 所 示 ， 在 一 个 操作 界面 上 ， 把 开关 扳 上 去 表示 1， 扳 下 来 表示 
0。 图 中 表示 的 是 10110111 (183 ) +00010110 ( 22 ), 输出 的 结果 是 011001101 (205 )。 
而 对 于 复杂 一 些 的 操作 (例如 减法 )， 可 以 在 面板 上 增加 一 个 选择 做 加 法 或 做 减法 的 
和 额外 开关 来 实现 。 对 于 更 多 的 操作 ， 则 可 以 相应 地 添加 更 多 的 开关 进行 控制 。 


人 
二 Wd 
| 


3-18 ”加 法 操作 示意 图 
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Intel 8080 于 1974 年 4 月 发 布 , 作为 英特尔 早期 发 布 的 处 理 融 , 它 集成 了 6000 只 
晶体 管 ， 除 了 上 述 提 到 的 加 减 运算 和 数据 复制 以 外 ， 还 文 持 存 数 、 取 数 等 更 多 指令 。 
这 款 CPU 用 在 了 1975 年 风靡 美国 的 最 早 的 个 人 计算 机 牛 郎 星 8800 ( 见 图 3-19 ) 上 
面 。 在 这 人 台 机 器 上 ， 操 作 是 通过 图 中 的 这 些 开关 来 扳 动 输入 的 ， 计 算 的 结果 是 通过 上 
面 的 指示 灯 显 示 出 来 的 。 当 然 在 今天 看 来 ,这 实在 是 太 简 陋 了 ,后 来 它 的 后 续 作 品 8086、 
80286、80386、80486 等 持续 进行 了 改进 ， 开 创 了 英特尔 X86 电脑 系列 的 辉 烛 时代。 


3-19 最早 的 个 人 计算 机 一 一 牛 即 星 8800 


号 点 能 让 人 理解 的 东西 一 一 编程 语言 


到 目前 为 止 ， 通 过 基本 的 逻辑 门 设计 和 相应 的 运算 指令 的 实现 ， 一 台 计 算 机 的 硬 
件 部 分 就 已 经 设计 完毕 了 。 如 前 所 述 ， 真 正 的 计算 机 在 运行 的 时 候 ， 是 通过 逐条 读 取 
存放 在 内 存 中 的 相应 指令 然后 进行 各 种 计算 和 操作 实现 的 。 类 似 10 0000 和 20 0001 的 
被 机 器 所 识别 并 运行 的 机 顺 指 令 或 操作 指令 ， 会 被 编码 成 方便 人 类 理解 的 助 记 形 式 如 
Load 0000 和 Add 0001。 这 就 是 汇编 语言 。 


以 菏 种 假想 的 汇编 语言 为 例 ， 来 看 一 个 从 1 到 100 累加 求 和 的 计算 过 程 。 前 面 的 
数字 表示 语句 序号 ，# 吕 后 面 表示 解释 说 明 。 
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1 mov @100 ,RO # 将 100 存 入 到 内 存 的 RO 单元 ， 用 于 计数 

2 mov @0 ,A # 累加 计算 结果 ， 初 始 值 设置 为 0 

3 mov @1 ,R1 # 用 于 增加 计算 

4 Loop: # 表示 以 下 部 分 循环 执行 

5 add A,R1 # 将 A 的 值 和 R1 中 的 值 相 加 后 存 入 人 

6 inc R1 # R1 中 的 数 增加 1 

7 dec RO # RO 中 的 数 减 少 1 

8 jez RO LO # 判断 如 果 RO 中 的 值 大 于 0， 则 转 到 Loop 处 运行 
9 jmp $end # 转 到 End 

10 End # 程序 结束 停止 ， 最 终 的 计算 结果 存在 人 中 


虽然 这 样 的 程序 写 起 来 已 经 比 下 接 的 机 带 圭 言 要 方便 很 多 , 但 还 是 不 够 方便 ， 因 
此 需要 提供 高 级 编程 语言 让 用 户 使 用 。 对 于 上 述 的 汇编 语言 实现 的 功能 ， 现 在 绝 大 多 
数 的 高 级 编程 语言 (例如 C 语 言 ) 实现 起 来 应 该 是 这 样 的 : 


i=1,Sum=0,count=100; # 计数 器 设 为 100， 累 加 计算 结果 设 为 0 
while(count-->0) { # 计数 器 大 于 0 的 时 候 ， 计 数 器 减 一 并 循环 执行 {} 中 的 内 容 
sum=Sum+i; # 每 次 将 sum 值 与 i 的 值 相 加 ， 结 果 存 在 sum 中 

TE # i 的 值 增加 1 


为 了 在 一 台 计 算 机 上 实现 上 述 功能 ， 我 们 需要 能 够 实现 语言 之 则 转换 的 编译 途 。 
编译 需 指 的 是 能 够 将 一 种 源 语 言 翻译 成 另 一 种 目标 语言 的 程序 。 在 上 述 计 算 机 中 , 我 
们 需要 实现 两 个 编译 需 ， 一 个 将 高 级 语言 编译 成 汇编 语言 ， 另 一 个 将 汇编 语言 编译 成 
机 器 语言 ， 过 程 如 图 3-20 所 示 。 


| C 语 计 上 汇编 语言 | 机 器 指令 | CPU 运行 | 


3-20 高 级 语言 到 机 器 运行 的 过 程 


编 详 大 的 实现 旦 一 个 较为 复杂 的 过 程 。 一 般 首 匈 对 源 语 言 程序 进行 扫 摘 ,将 其 中 
的 一 些 关 键 字符 和 存储 数据 的 变量 进行 相应 的 转换 和 处 理 , 并 将 源 语言 的 相应 操作 对 
应 到 目标 语言 上 去 。 在 实际 的 编译 过 程 中 ,党 要 进行 多 次 反复 处 理 才 能 够 生成 最 终 的 
目标 寺 言 。 


以 上 面 这 段 简 单 的 程序 为 例 ,为 了 实现 把 这 段 语言 转换 成 汇编 博 言 的 过 程 ， 主 要 
包括 词法 分 析 、 语 法 分 析 、 语 义 分 析 、 目 标 代 人 码 生 成 几 个 阶段 。 下 面 我 们 一 一 介绍 。 
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词法 分 析 

词法 分 析 , 主要 是 把 源 代 码 里 面 所 有 的 字符 串 全 部 谈 进 来 , 然后 进行 扫描 和 分 解 ， 
把 常量 、 变 量 名 、 运 算 和 从 、 关 键 字 等 标识 出 来 。 例 如 对 于 上 述 例子 中 的 语句 i=1， 
sum=0,Count=100; ， 需 要 将 其 正确 地 识别 成 如 下 的 序列 i=1，sum=0， count=100 ; ， 
而 不 会 犯 把 100 识别 成 1 0 0 三 个 字符 这 样 的 错误 。 


语法 分 析 

此 阶段 主要 是 在 词法 分 析 的 基础 上 将 识别 出 来 的 单词 序列 按照 该 语言 的 语法 要 
丢 识 别 出 相 应 的 语法 单位 。 如 上 和 句 中 一 共有 三 个 表达 式 ， 而 且 表 达 式 本 身 可 以 通 套 递 
月， 如 count-- 是 表达 式 ，count-->0 同样 是 表达 式 。 


试 试看 

在 Windows XP 系统 下 ， 陆 续 点 “开始 -> 运行 ， 在 其 中 输入 “debug”， 
然后 点 “确定 ”， 在 弹出 的 黑色 窗口 里 面 输入 “u”， 然 后 回 车 ， 即 看 到 了 
Windows 下 的 汇编 语言 和 机 器 指令 。 如 第 一 行 所 示 ，0B65:0100 表示 该 行 语 
铅 在 内 存 中 存储 的 位 置 ，004074 就 是 后 面 那 名 ADD [BX+SI+74],AL 汇编 语句 
对 应 的 机 器 指令 ， 实 际 系 统 运行 的 时 候 ， 就 是 按照 这 样 一 条 条 的 机 器 指令 运 


说 明 : 微软 从 DOS 系统 开始 一 直到 Windows XP 都 带 有 debug 功能 , 之 
后 的 系统 就 不 支持 了 。 


cv 命令 提示 符 - debug 


站 加 半 加 了 圭 [BAST+74].AL 
122EC706 CH -LTBecr ] 

| Da 

91 心 上 -让 上 

515 [BAR+ST 1.AL 

i H202 

833E4A9109 WORD FIR [314A 1],+09 
te | J B156 


dl As .Bi1A0 
T4415 B138 

2E : 

| AL .Ba 

5 和 aP 

HBAG hn. [BR+SI] 


第 3 章 ”从 零 开始 的 计算 机 系统 | 77 


语义 分 析 


义 分 析 的 主要 作用 是 判断 整个 源 程序 代码 里 面 是 否 有 错误 , 如 在 C 语 言 中 对 于 
否 已 经 声明 、 语 句 是 否 以 分 号 结束 、 运 算 的 对 象 是 否 合理 等 进行 整体 审查 。 


Dt 
月 


入 


六 


二 
里 征 


目标 代码 生成 


将 源 代码 转换 成 目标 代码 的 过 程 是 最 重要 也 是 最 复杂 的 阶段 。 如 上 例 所 示 ,将 i=1; 
sum=0, count=100; 语 句 中 的 三 个 赋值 表达 式 转换 成 了 三 条 Mov 汇编 指令 ,存在 三 个 寄 
存 甫 中， 然后 把 while 语句 的 范围 转换 成 loop 和 end 之 间 的 代码 ，sum=sum+i ;转换 成 
add A,R1，i++ 转 换 成 inc R1，count-- 转 换 成 dec Ro， 而 while(count-->0) 则 转换 
成 jgz RO，Loop。 


通过 上 述 几 个 过 程 , 系统 就 把 这 段 C 语 言 代 人 码 生 成 了 汇编 语言 的 代码 。 当 然 对 于 
真正 实现 工业 级 的 语言 编译 瘟 来 婉 ， 往 往 需 要 对 源 语 言 进行 多 次 扫描 ,还 要 经 过 中 间 
代码 生成 和 代码 优化 等 阶段 ， 才 能 生成 优化 的 目标 代码 。 

从 汇编 语言 转换 到 机 硕 指 令 的 基本 过 程 也 差不多 , 而 且 这 个 过 程 往往 比 高 级 语言 
转换 到 汇编 语言 要 简单 。 因 为 在 设计 CPU 时 ， 人 们 对 于 相应 的 操作 基本 上 已 经 给 出 
了 相应 的 操作 码 。 例 如 上 述 举 的 Intel 8080 芯片 的 例子 ， 其 mov 操作 就 是 最 终生 成 的 
机 融 指 令 : 从 40 到 SF 的 一 系列 数字 。 因 此 机 融 语 言 完全 就 是 数字 的 序列 。 这 样 就 完 
成 了 从 高 级 语言 到 计算 机 能 够 运行 的 代码 的 过 程 。 


其 实 对 于 编程 语言 来 说 ， 霹 言 的 关键 字符 、 书 写 形 式 等 构成 的 是 语言 的 霹 法 ,但 
语言 的 强大 与 否 并 不 在 于 语法 ， 而 在 于 提供 的 相应 操作 函数 的 数量 ， 一 般 语言 提供 的 
大 量 相 关 函 数 称 为 类 库 "。 在 实现 自己 的 编程 语言 时 ， 除 了 需要 实现 语言 的 编译 器 以 
外 ， 更 多 的 是 需要 提供 强大 的 、 适 用 的 羡 数 的 类 库 。 例 如 前 面 的 语言 ， 如 采 提 供 一 个 
叫 sum 的 累积 求 和 函数 ， 只 需要 一 行 语 句 sum(1,100) 就 可 以 实现 从 1 加 到 100 的 加 法 
计算 功能 。 由 于 不 同 的 语言 设计 目的 不 同 ， 国 数 库 侧重 不 同 ， 因 此 不 同 的 语言 适用 于 
不 同 的 功能 。 如 进行 数学 统计 更 适合 用 及 或 者 SAS; 对 于 计算 来 说 ，Matlab 是 一 个 极 
其 好 用 的 科学 计算 需 ; 进行 快速 Windows 窗口 开发 , C# 或 者 Visual Basic.NET 更 适合 ; 
当然 对 于 老 一 辈 的 程序 员 来 说 ，Delphi 和 Visual Basic 6 会 来 得 更 加 亲切 一 些 。 


(除了 语言 本 里 的 标准 以 外 ,例如 Java 和 Python， 由 于 其 开源 的 特性 ,有 大 量 的 第 三 方 类 库 能 够 文 持 
特定 的 功能 。 
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但 是 从 本 质 上 来 说 , 所 有 的 语言 都 是 等 价 的 ,任何 二 言 痢 可 以 通过 编 详 珊 实现 从 
一 种 语言 到 万 外 一 种 语言 的 转换 。 已 经 有 很 漂亮 的 数学 定理 对 其 进行 了 证 明 ， 对 这 部 
分 内 容 有 兴趣 的 读者 可 以 参考 本 书 第 2 章 的 相关 内 容 。 


灵魂 和 守护 者 一 一 操作 系统 


前 面 已 经 讲述 了 从 逻辑 门 到 编程 语言 的 整个 过 程 ， 但 是 不 知道 你 有 没有 注意 到 ， 
从 开始 到 现在 ， 所 有 的 例子 都 上 只 提 到 了 加 减法 〈 哮 ! 我 们 造 个 计算 机 ， 可 不 只 是 为 了 
满足 小 学 三 年 级 的 数学 课 )。 对 于 一 全 真正 的 计算 机 ， 哪 伯 能 够 算出 宇宙 尽头 毁灭 的 
时 刻 ， 对 于 大 多 数 人 来 说 ， 也 不 如 能 够 玩 个 植物 大 战 伪 尸 或 者 看 个 美国 大 万 有 用 。 所 
以 ， 我 们 的 计算 机 能 够 做 的 可 不 仅仅 只 是 算 算 数 。 

作为 一 套 计 算 机 系统 ， 除 了 最 核心 的 计算 单元 CPU 以 外 ， 还 需要 通过 操作 系统 
将 其 和 存储 胡 、 输 入 、 输 出 设备 连接 在 一 起 ,， 才 能够 形成 完整 可 用 的 计算 机 系统 
这 就 是 操作 系统 需要 做 的 事情 ， 功 能 示意 图 见 图 3-21。 


输入 〈 键 盘 / 鼠 标 ) 输出 (屏幕 ) 
CPU 存储 器 (内 存 / 外 存 ) 操作 系统 ， 


3-21 ”操作 系统 功能 示意 图 


输出 : 为 了 使 从 1 加 到 100 的 计算 结果 能 够 显示 在 计算 机 屏幕 上 ， 我 们 需要 在 内 
存 中 留 出 特定 的 区 域 存放 用 于 显示 的 内 容 ， 在 CPU 通过 指令 的 运行 把 数据 存放 在 特 
定 的 内 存 位 置 上 以 后 ， 操 作 系统 负责 不 断 地 将 这 些 特定 区 域 的 内 容 在 屏幕 上 显示 出 
来 。 在 这 个 过 程 中 ， 要 适应 不 同 的 分 辨 率 ， 计 算 在 显示 天 上 输出 的 位 置 。 为 此 ， 操 作 
系统 需要 适应 不 同 的 显示 设备 ， 根 据 不 同 的 设备 运行 不 同 的 驱动 程序 。( 在 早年 的 操 
作 系 统 上 ， 驱 动 程序 不 全 的 时 候 ， 图 像 分 辨识 会 显得 很 低 ， 现 在 的 操作 系统 基本 上 已 
经 能 够 瞻 兰 一 般 的 驱动 程序 ， 不 再 需要 妃 外 安装 驱动 程序 了 。 ) 


输入 : 同样 ， 操 作 系 统 需要 接收 键盘 的 输入 ， 在 键盘 皮 生 了 按键 按 动 作 时 ， 需 要 
得 到 触发 的 通知 ， 将 按键 的 电信 号 转换 为 相应 的 字符 ， 并 不 断 将 接收 到 的 字符 存在 指 
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定 内 存 区 域 ， 供 计算 机 中 运行 的 程序 使 用 。 


在 程序 员 进 行 高 级 语言 编程 时 ， 我们 希望 通过 诸如 printf(“100”)、getchar 之 类 
的 命令 就 能 够 实现 输出 和 输入 的 功能 ， 操 作 系 统 负 贡 实现 具体 的 细 方 功能 。 


在 简单 的 计算 机 模型 中 ,操作 系统 主要 人 负责 的 功能 有 了 两 点 : 一 是 封 沪 对 于 底层 的 
便 件 实现 , 二 是 提供 更 多 的 也 数 支持 更 多 的 功能 , 例如 提供 drawline 之 类 的 函数 支持 
在 屏 雄 上 实现 划 线 的 操作 。 因 此 ， 这 个 音义 上 的 操作 系统 与 前 面 提 到 的 语言 的 类 库 之 
间 的 界线 并 不 是 特别 明显 。 现 在 主流 的 操作 系统 Windows、Unix 和 Linux， 由 于 设置 
了 不 同 程序 对 于 硬件 的 访问 权限 和 优先 级 的 控制 ， 这 个 界面 切 分 得 很 清楚 ， 基 本 上 在 
高 级 语言 层面 是 不 允许 二 接 访问 底层 便 件 的 。 


前 面 从 如 何 通过 基本 的 与 、 或 、 非 轨 辑 门 开始 构造 计算 机 的 硬件 用 以 实现 相应 的 
8 令 集 ,以 及 在 与 指令 集 完全 对 应 的 机 英语 言 上 通过 汇编 语言 进而 到 高 级 语言 来 编写 
计算 程序 ,说 明了 构造 一 台 计算 机 的 主要 过 程 。 在 整个 系统 的 构造 过 程 中 ， 最 后 一 个 
环节 就 是 操作 系统 ， 操 作 系 统 是 用 来 衔接 计算 机 的 硬件 系统 和 软件 系统 的 ,使 一 台 计 
算 机 对 于 用 户 来 说 真正 可 以 使 用 。 

关于 操作 系统 的 实现 ,很 多 书 中 都 有 详细 的 描述 ， 相 关内 容 较 多 ， 可 参考 “推荐 
阅读 ”中 相应 的 书目 。 在 自己 实现 操作 系统 时 ， 建 议 将 前 述 的 高 级 语言 和 简单 的 操作 
系统 合并 在 一 起 进行 设计 实现 ， 在 不 考虑 过 多 细节 的 情况 下 ， 可 以 降低 实现 的 难度 。 


路 漫漫 其 修 远 今 一 一 从 计算 到 智能 


计算 机 本 质 上 就 是 用 来 计算 的 。 从 最 早 用 于 专业 计算 用 途 的 大 型 机 需 ， 到 走 入 千 
家 万 户 的 个 人 计算 机 ， 再 到 近来 日 益 流 行 的 智能 手机 和 平板 电脑 ， 计 算 机 在 短 短 几 十 
年 内 发 生 了 重大 变化 ， 其 应 用 日 益 多 样 化 ， 但 是 我 们 所 接触 到 的 各 类 生产 、 办 公 、 科 
研 、 娱 乐 等 程序 ， 几 乎 都 是 以 计算 机 程序 的 形式 表现 出 来 的 。 图 3-22 展示 了 现代 计算 
机 系统 的 主要 结构 ， 当 一 个 计算 机 程序 运行 时 ， 我 们 从 软件 到 硬件 来 观察 ， 就 会 发 现 
每 一 层 的 表现 形式 完全 不 一 样 ,但 是 本 质 上 都 是 计算 ， 而 且 每 一 层 都 是 建立 在 下 一 层 
的 基础 上 的 。 虽 然 分 了 这 么 多 层 , 但 所 有 的 层 都 是 等 价 的 。 层 和 层 之 间 有 清楚 明确 的 
边界 ， 越 到 下 层 牵涉 到 的 基础 单元 越 多 ， 越 到 上 层 越 简 洛 。 
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应 用 程序 
一 项 基本 功能 操作 系统 
一 一 一 计算 机 软件 
40 行 高 级 语言 高 级 语言 
400 行 汇编 语 句 
3000 行 机 器 指令 机 器 指令 | 
50000 个 逻辑 元 件 计算 机 体系 结构 
200000 个 逻辑 门 ”运算 单元 和 内 存 
3 种 逻辑 元 件 逻辑 门 二 


图 3-22 ”现代 计算 机 系统 主要 结构 


天 于 多 层次 有 很 多 故事 。 例如 , 在 电影 《 咨 梦 空间 》 中 ， 更 深层 次 的 梦境 可 以 影响 
最 外 层 的 人 的 行为 和 意识 。 其 实 不 光 是 梦境 ， 我 们 的 世界 本 里 束 是 在 多 层次 上 运行 的 。 


在 古老 的 故事 “和 望 梅 止 淘 ” 中 ,士兵 们 被 想象 中 的 梅子 引诱 得 不 住 流 口 水 的 过 程 
实际 上 就 是 一 个 非常 复杂 的 多 层次 系统 运行 的 过 程 〈 如 图 3-23 所 示 ) 由 梅子 这 个 概 
念 到 引起 口水 的 分 泥 ， 我 们 平 稼 都 只 从 概念 的 层面 来 提 及 ,但 实际 上 从 概念 到 号 体 反 
应 ， 作 用 是 一 层 层 产生 的 。 在 吴 体 系统 之 下 ， 还 有 更 低 的 层次 ， 如 需 官 、 细 胞 、 重 日 
质 、DNA 分 了 于。 真实 的 世界 是 在 无 效 的 层次 上 运行 着 的 。 


概念 和 思维 梅子 的 形象 回忆 


梅子 的 口感 回忆 


大 脑 神 经 系统 激活 | |] 
神经 系统 递 质 传递 | “je 身体 系统 

唾液 的 分 泌 | 

| EDS 


图 3-23 ” 望 梅 止 渴 的 反应 过 程 


我 们 构造 的 多 层次 计算 机 系统 和 真实 世界 的 系统 的 区 别 在 哪 呢 ? 或 者 说 , 我 们 能 
人 否 通过 计算 机 系统 来 完全 模拟 真实 的 世界 ， 从 而 找到 智能 的 本 质 呢 ? 
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这 是 一 个 关于 意识 和 物质 、 机 械 与 智能 的 根本 性 问题 ,对 于 构造 计算 机 系统 的 次 
入 思考 ， 只 是 探索 旅途 的 一 个 起 点 。 


由 于 篇 幅 所 限 ， 对 于 如 何 构造 一 人 台 模 型 级 的 计算 机 系统 ,这 里 只 是 做 了 一 个 概要 
性 的 描述 ， 真正 要 实现 这 样 一 个 系统 ， 还 有 很 多 的 细 市 需要 进一步 了 解 。 


想 要 了 解 整体 计算 机 结构 ， 推 荐 阅读 《计算 机 系统 要 素 》 这 是 本 章 主要 的 思想 
来 源 ， 还 可 以 阅 谈 《 编 码 》 和 《《 通 灵 必 上 户 方 如 条 想 对 真实 的 计算 机 系统 结构 有 更 次 
人 和信 的 了 解 ， 可 以 阅读 《深入 理解 计算 机 系统 》。 

关于 人 硬件 设计 的 部 分 , 推荐 阅读 《数字 逻辑 基础 与 Verilog 设计 》, 如 果 觉 得 太 厚 ， 
可 以 阅读 夏 衬 闻 老 师 的 《Verilog 数字 系统 设计 教程 》， 这 两 本 书 讲 的 是 设计 原理 和 语 
法 。 具 体 的 实现 可 以 参考 《Altera FPGA/CPLD 设计 (基础 篇 ) 》《Altera FPGA/CPLD 
设计 (高 级 篇 ) 》， 这 两 本 书包 含 了 Altera 需 件 介绍 、quartus 的 使 用 和 FPGA 设计 的 
一 些 高 级 技能 。《CPU 自制 入 门 》 讲 述 了 如 何 设 计 一 块 CPU 以 及 如 何在 电路 板 上 实 
现 ， 有 一 定 经 验 以 后 可 作为 参考 。 


关于 语言 编译 的 部 分 , 对 于 原理 和 理论 的 学 习 推荐 阅读 Alfred V Aho 的 《编译 原 
理 : 原理 、 技 术 与 工具 》， 实 践 的 书 可 以 阅读 《 目 制 编程 语言 >;， 想 要 了 解 一 些 实际 的 
编程 语言 如 何 实 现 , 可 以 阅读 《深入 Java 虚拟 机 》《 深 入 理解 Java 虚拟 机 》 和 《Python 
源码 训 析 》。 

关于 操作 系统 , 理论 部 分 可 以 阅读 《UNIX 操作 系统 设计 》 和 《Linux 内 核 设 计 与 
实现 》， 实 践 的 书信 门 级 的 有 《30 天目 制 操作 系统 》 和 《日 已 动手 写 操 作 系 统 》， 进 阶 
的 书 比 较 全 面 的 是 《Linux 内 核 完 全 前 析 广 
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很 多 年 前 的 一 个 下 午 ,， 当 窗外 明媚 的 阳光 针 斜 地 穿 过 图 书馆 透明 的 玻璃 
墙 ， 穿 过 泛 着 零 黄 味道 的 书架 ， 照 在 我 坐 的 那 张 明黄 色 木 束 上 的 时 候 ， 我 手 
里 正 拿 着 那 本 《复杂 : 诞生 于 秩序 与 边缘 的 科学 》 没 错 ， 就 是 那 本 影响 了 
很 多 人 世界 观 的 书 。 从 那天 起 ， 有 一 个 问题 始终 让 我 不 得 其 解 : 一 个 能 够 不 
断 生长 并 在 生长 中 不 断 变化 的 系统 如 何 才 有 可 能 实现 ? 

带 着 这 个 问题 一 路 走 来 ， 已 经 近 十 年 了 ， 从 充满 激情 付出 巨大 的 努力 重 
转 专业 ， 到 后 来 因 不 满 国 内 科研 环境 而 放弃 科研 理想 ， 再 到 毕业 之 后 不 断 地 
被 生活 打磨 ， 年 轻 的 心情 和 曾经 的 激情 都 在 慢 慢 消失 。 

直到 2010 的 某 一 天 ， 因 为 豆 辩 上 的 活动 介绍 参加 了 集 智 俱 乐 部 在 套 号 
会 所 的 读书 会 活动 ， 我 重新 拾 起 了 对 于 当年 那个 问题 的 思 者 。 最 初 的 问题 变 
成 了 三 个 问题 : 现 有 的 计算 机 系统 是 什么 样子 的 ? 在 现 有 的 计算 机 系统 上 能 
不 能 方便 地 实现 自我 学 习 和 演进 ? 如 果 不 能 的 话 ， 需 要 有 什么 样 的 计算 机 系 
统 才 能 够 实现 自我 学 习 ? 

在 那 年 的 《可 德尔 、 艾 铭 尔 、 巴 赫 : 集 异 壁 之 大 成 》 读 书 会 上 ， 大 家 对 
于 层次 的 问题 讨论 了 很 多 。 张江 提出 可 以 尝试 实现 一 套 能 够 递归 实现 自 指 的 
计算 机 系统 用 以 回答 第 二 个 问题 , 我 当时 很 乐观 地 说 只 需要 两 三 年 就 能 够 实 
现 。 现 在 四 年 过 去 了 ， 工 作 越 来 越 已 ， 用 于 学 习 和 思考 的 时 间 十 分 有 限 ， 现 
在 只 能 初步 回答 第 一 个 问题 ,下 准备 尝试 开始 第 二 个 问题 。 无 论 你 看 到 本 书 
的 时 候 身 在 何 处 ,做 着 什么 ， 只 要 你 愿意 思考 并 尝试 做 点 什么 ， 都 欢迎 你 加 
入 集 智 俱乐部 ,与 我 们 一 起 探索 复杂 有 系统。 大 道 至 简 , 走 在 追求 科学 真理 的 
道路 上 ， 任 重 而 道 远 ， 且 行 且 珍惜 。 
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所 谓 的 人 工 知 能 ,就 是 让 人 关 用 目 己 的 智 翡 去 破解 智 六 本 吴 的 奥秘 。 人 工 智能 从 
一 诞生 ， 就 逃 不 挥 与 目 指 (self-reference )、 缠 结 的 层次 等 概念 之 则 的 纠缠 。 


很 多 人 认为 ， 哥 德尔 定理 的 出 现实 际 上 早已 经 为 人 工 智能 树立 了 墓碑 。 然 而 ,本 
文 则 试图 指出 ， 目 指 可 以 有 多 种 类 型 。 哥 德尔 定理 、 罗 系 分 论 、 图 灵 俘 机 问题 等 仪 仅 
利用 了 破坏 性 的 和 目 指 悖 论 ,但 实际 上 还 存在 着 为 外 一 类 日 指 是 建构 型 的 , 它 不 仅 无 害 ， 
而 且 还 与 生命 的 起 源 、 目 我 繁殖 以 及 人 类 的 目 由 意识 等 问题 有 关 。 计 算 理 论 中 的 递归 
定理 告诉 我 们 ， 所 有 这 些 神 奇 的 目 指 能 力 都 可 以 通过 计算 机 程序 来 实现 ， 这 无 颖 为 我 
们 实现 人 工 智能 提供 了 全 新 的 途径 。 


《 哥 德 尔 、 艾 舍 尔 、 巴 赫 : 集 异 壁 之 大 成 》 


介绍 缠 结 的 层次 结构 这 一 主题 的 最 好 的 一 本 书 就 是 《 哥 德 尔 、 艾 舍 尔 、 巴 赫 : 集 
异 壁 之 大 成 》( Godel, Escher, Bach: An Eternal Golden Braid， 简 称 GEB ) “， 见 图 4-1。 


(DD 集 智 俱 乐 部 曾 于 2009 年 的 9 月 至 2011 年 3 月 组 织 过 关于 《 哥 德 尔 、 艾 舍 尔 、 巴 赫 : 集 异 壁 之 大 成 》 
的 读书 会 。 这 一 期 是 集 智 俱乐部 有 史 以 来 持续 时 间 最 长 的 一 次 读书 会 。 讨 论 内 容 更 是 空前 广泛 : 从 
卡农 、 赋 格 等 最 基本 的 音乐 概念 到 如 何 欣 贷 埃 舍 尔 (GEB 这 本 书 将 Escher 译 为 “ 艾 售 尔 "， 本 书 采 
用 了 更 常用 的 译名 “ 挨 舍 尔 ”) 的 画作 ， 从 摆弄 电视 机 /摄像 机 上 自 指 游戏 再 到 人 工 知 能、 大 脑 结构 、 
生命 的 起 源 等 。 参 与 人 员 也 赛 括 了 三 教 九 流 、 五 淹 四 海 、 各 行 各 业 的 人 ， 有 高 等 院 校 的 科学 至 年 ， 
也 有 社会 上 的 科学 爱好 者 。 所 有 这 些 人 被 GEB 这 本 书 ， 以 及 该 书 所 讨论 的 那 条 永恒 的 金 市 深 次 地 
联系 到 了 一 起 。 
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此 书 发 现 了 一 条 贯穿 于 著名 的 数学 家 凡 德 尔 、 著 名 的 版 画家 埃 舍 尔 以 及 著名 的 音乐 家 
巴赫 之 间 的 永恒 的 金融 : 缠 结 的 层次 结构 或 目 指 。 不 仅 如 此 ， 该 书 还 指出 ， 这 条 永恒 
的 金 带 还 将 连接 人 工 智 能 的 终极 难题 以 及 生命 的 奥秘 。 这 是 一 本 关于 数理 逻辑 、 人 工 
镶 能 、 计 算 机 的 科普 书 ， 但 是 却 获得 了 普 利 蛇 文学 燃 ， 原 因 是 该 书 的 学 里 行 间 充 斥 着 
大 量 的 上 暗语、 隐喻 、 回 文 、 产 头 诈 答 各 类 噩 超 而 巧妙 的 修 梧 手 法 和 语言 技巧 。 无论 是 
书 的 内 容 ， 还 是 表述 方式 ， 都 与 那 条 永恒 的 金 市 一 一 缠 结 的 层次 结构 一 一 密切 相关 。 
有 趣 的 是 ,该 书 虚 拟 了 阿 基 里 斯 和 与 包 这 两 个 活泼 可 爱 的 人 物 ， 他们 巧妙 的 对 话 与 正 
文部 分 内 容 肥 相 呼 应 ， 把 所 有 的 主题 再 次 用 生动 的 语言 表现 出 来 。 无 穷 般 套 的 梦境 、 
日 我 实现 的 预言 、 虚 拟 和 实在 的 题 倒 与 互 换 一 一 你 会 在 阿 基 里 斯 与 乌龟 的 对 话 中 发 现 
很 多 出 现在 《 盗 梦 空 间 》 光 黑客 帝国 》 等 影 族 中 的 情景 或 手法 ， 或 许 正 是 这 本 书 激 发 
了 这 些 后 现代 影 帮 的 艺术 创作 灵感 。 


GOIDIELL 
SOGnIalR 


4-1 中 、 英 版 本 的 GEB 


GEB 的 作者 也 是 一 位 奇人 ,他 就 是 大 名 易 易 的 候 世 达 ( Douglas Hofstader )。 他 的 
父亲 罗 们 特 . 霍 夫 施 塔 特 (了 Robert Hofstader ) 是 一 名 诺 见 尔 物 理学 奖 得 主 。 年 轻 时 他 
追随 父亲 的 脚步 ， 攻 读物 理学 的 博士 学 位 。 然 而 ， 就 在 他 即将 毕业 的 时 候 ， 他 的 兴 
趣 却 转向 了 其 他 地 方 : 人 类 的 意识 之 谜 以 及 人 工 智能 。 于 是 ,他 28 岁 开始 写作 GEB 
这 本 书 ， 并 因此 一 举 成 名 。 该 书 为 他 帮 来 了 很 多 来 誉 ， 并 让 他 普 升 成 为 美国 印第安 纳 
大 学 的 终身 教授 。 于 是 ,他 可 以 在 没有 发 表 文 草 的 压力 下 按照 自己 的 另类 思路 探索 人 
工 知 能。 然而， 目前 人 工 智能 界 的 主流 领域 却 看 不 到 他 的 身影 ， 因 为 侯 世 达 认 为 ， 现 
在 主流 的 研究 虽然 很 厉害 ， 但 是 却 与 真正 的 人 工 智 能 没有 半点 关系 。 

更 值得 一 提 的 是 ， 这 本 书 的 中 文 翻译 非常 值得 称赞 。 据 三 位 详 痢 严 勇 、 刘 了 指明 和 
莫大 伟 说 ， 最 早 的 译文 是 将 英文 直接 翻译 过 来 的 , 但 是 这 不 符合 侯 世 达 的 要 求 一 一 按 
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照 丛 世 达 的 说 法 ,这 种 耻 详 就 像 是 跑 了 汽 儿 的 可 乐 。 于 是 ,他们 根据 原文 的 中 心思 想 
设计 了 一 些 中 文本 土 化 的 例子 ， 包 括 很 多 藏 头 诗 、 双 关 语 、 回 文 等 高 超 技巧 的 使 用 。 
因此 ， 这 本 书 的 翻译 是 一 次 典型 的 再 创作 过 程 。 


缠 结 的 层次 结构 一 一 一 条 永恒 的 金 市 

那么 , GEB 这 本 书 究竟 在 说 些 什么 呢 ? 虽然 这 本 书 钢 强 可 以 算是 一 本 有 关 数 理 池 
辑 、 人 工 智能 的 科普 书 , 但 在 内 容 上 却 远 不 止 如 此 。 事 实 上 ，GEB 所 讨论 的 核心 是 一 
种 被 称 为 “ 缠 结 的 层次 结构 ”的 奇特 现象 。 这 种 现象 不 属于 某 一 个 具体 的 学 科 ， 而 是 
横 跨 于 各 种 学 科 、 各 种 系统 之 上 。 接 下 来 ， 我 们 就 从 层次 和 层次 纠缠 等 概念 出 发 ， 一 
层 层 地 脱 去 缠 结 的 层次 结构 的 神秘 外 衣 。 


层次 
层次 是 一 类 极其 抽象 但 又 普 这 存在 于 日 弟 生 活 中 的 现象 。 下 面 我 们 举 几 个 例子 。 
高 低 


楼 梯 就 是 一 个 典型 的 层次 结构 ， 每 一 节 楼 梯 代 表 一 个 层次 , 沿 着 楼 梯 向 上 就 能 运 
层 升 高 。 

尺度 

尺度 是 另外 一 种 层次 。 当 我 们 用 鼠标 扩大 、 缩 小 谷歌 地 图 的 时 候 ， 就 能 轻松 地 体 
会 到 不 同 的 尺度 层次 。 基 中 ,大 比例 尺 的 图 片 是 小 比例 尺 图 片 的 上 一 层 。 一 张大 比例 
的 图 片 是 由 很 多 小 比例 图 片 组 合 而 成 的 。 

虚拟 层次 

虚拟 层次 是 一 种 比 上 述 两 种 层次 更 加 抽象 的 层次 概念 ， 很 难 清晰 地 定义 。 不 过 ， 
我 们 可 以 举例 说 明 。 

从 前 有 座 山 ， 山 里 有 座 庙 ， 庙 里 有 一 个 老 和 尚 讲 故 事 :“ 从 前 有 座 山 ， 

山里 有 座 庙 ， 庙 里 有 一 个 老 和 尚 和 小 和 尚 ， 老 和 尚 给 小 和 尚 讲 故事 :“ 从 前 

有 座 山 ， 山 里 有 座 庙 ……. 有 

我 们 看 到 ， 这 种 故事 套 故 事 的 情形 就 构成 了 一 种 层次 结构 ， 我 们 称 为 虚拟 层次 。 
其 中 ， 单 引号 中 的 句子 是 比 双 引 号 中 的 句子 更 “虚拟 ”的 下 一 层 。 当 我 们 阅读 小 说 、 
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观看 电影 或 置 号 游戏 的 时 候 ， 其 实 都 是 在 与 比 现 实 更 涤 一 层次 的 虚拟 世界 打 交 赴 。 虚 
拟 层次 的 概念 经 稼 出 现在 小 说 或 者 影视 作品 中 。 例如, 在 影片 《 资 梦 空间 》( 见 图 4-2 ) 
中 ， 梦 中 之 梦 就 构成 了 更 深 一 层 的 虚拟 层次 。 


层次 的 混 浓 

一 个 完美 的 层次 结构 应 该 是 一 棵 树 , 其 中 上 层 和 下 层 之 间 的 分 别 清晰 可 见 。 然 而 ， 
在 有 些 情况 下 ， 本 该 属于 不 同 层次 的 东西 却 由 于 某 种 原因 混淆 到 了 一 起 ， 这 便 发 生 了 
层次 的 混淆， 或 者 叫 层次 的 缠 结 。 图 4-3 中 埃 合 尔 的 名 作 《 蚂 蚁 》 中 就 有 车 名 的 和英 比 
马 斯 带 ， 诗 子 的 两 端 混 到 了 一 起 。 图 4-4 中 埃 舍 尔 的 名 作 《 僧 侣 》 就 描述 了 一 种 高 度 
层次 之 间 的 混 消 。 


4-3 《蚂蚁 》 
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4-4 《僧侣 》 


假设 你 目 己 是 一 个 在 那个 循环 往复 的 楼 榜 上 不 停 和 奔 走 的 僧 介 ,你 会 发 现 , 尽管 你 
始终 沿 着 楼 梯 上 行 ， 却 会 在 同样 的 楼 梯 上 永 无 休止 地 循环 。 这 是 因为 画家 利用 绘画 的 
手段 ， 让 你 的 视 沉 解释 系统 发 生 了 错误 ， 从 而 把 本 属于 不 同 高 度 的 两 段 楼 樟 混 消 到 了 
一 起 。 有 一 款 叫 作 《 纪 念 碑 谷 》 的 小 游戏 ， 可 以 让 你 深刻 地 体验 这 种 空间 错觉 。 


让 我 们 再 来 看 一 个 矿 度 层 次 混 消 的 例 于 。 图 4-5 展示 的 是 一 张 日 相似 的 分 形 儿 何 
体 。 假 如 你 用 放大 镜 放 大 其 中 的 某 一 个 小 三 角形 ,你 就 会 发 现 这 个 小 三 角形 是 整个 大 
三 角形 的 副本 ,二 者 就 是 一 个 模子 刻 出 来 的 。 这 种 局 部 和 整体 的 相似 性 称 为 自 相 似 结 
构 ， 也 叫 分 形 〈fractal )。 人 们 发 现 ， 大 卓然 中 广泛 地 存在 着 类似 的 分 形 结构 ， 例 如 及 
化 、 云 尔 ， 甚 至 股票 价格 波动 曲线 。 
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4-5 分形 三 角形 (Sierpinski 三 角形 ) 


分 形 展 示 的 是 一 种 尺度 层次 上 的 混淆 。 假如 你 真 的 挥 到 一 个 分 形 儿 何 体 中 ,而 没 
有 任何 外 部 观察 作为 参考 ,那么 你 会 像 那些 可 怜 的 僧侣 一 样 困 惑 地 发 现 ， 你 已 经 摘 不 
清楚 上 自己 的 不 寸 有 多 大 了 了。 图 4-6 中 埃 人 铭 尔 的 这 幅 《画廊 》 则 将 虚拟 层次 的 混 消 表 现 
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一 个 年 轻 人 正在 一 间 画 廊 (尽管 已 经 严重 地 扭曲 变形 了 ) 中 欣 芝 画作。 他 面前 的 
这 幅 画 展现 的 是 一 个 安详 的 小 镇 : 有 一 条 河 ， 河 里 的 船只 不 是 很 多 ; 有 很 多 建筑 物 ， 
其 中 一 个 是 个 画廊 。 夯 廊 里 控 放 看 各 种 各 样 的 画作 。 一 个 年 轻 人 正在 画廊 中 ， 竟 静 地 
欣赏 着 面前 的 画作 …… 

也 就 是 说 ,这 位 年 轻 人 生活 在 他 面前 的 这 幅 男 作 之 中 。 画 作 这 个 虚拟 层次 中 展现 
的 内 容 恰 恰 就 是 这 幅 画 本 吴 。 于 是 深层 次 的 事物 与 浅 一 层 的 事物 发 生 了 重合 。 层 次 被 
画家 埃 舍 尔 用 独特 的 扭曲 方式 所 混淆 ， 于 是 缠 结 的 层次 出 现 了 。 


目 措 

埃 舍 尔 有 相当 多 的 的 画作 都 是 在 表达 这 种 怪圈 一 一 缠 结 的 层次 结构 ,而 更 加 司空 
见 惯 的 层次 混 酒 则 发 生 在 语言 中 。 

例如 ,“ 从 前 有 座 山 ”这 段 话 就 是 一 种 典型 的 用 语言 文字 表达 的 相互 强 结 的 虚拟 
层次 结构 ， 因 为 第 n+1 层 引号 中 的 句子 描述 的 东西 与 整个 句子 在 第 1 层 〈 不 帝 引 号 ) 
完全 同 构 (原则 上 ， 这 人 句 话 应 为 无 穷 长 )。 因 此 ， 这 两 个 层次 被 混淆 了 。 

在 语言 中 ,“ 这 ” “ 那 ” 等 代词 会 在 层次 缠 绪 中 起 到 至 关 重 要 的 作用 ， 因 为 它 可 以 
用 来 绕 过 无 穷 。 例 如 : 


这 和 句 话 没什么 意思 。 


“这 侣 话 ”这 个 代词 实际 上 只 是 对 无 穷 的 一 种 压 几 表 示 ， 完 整 的 句子 应 该 是 : 


“4 没什么 意思 ”没什么 意思 ”没什么 意思 ”没什么 意思 。” 


这 也 是 一 个 无 穷 延伸 的 层次 结构 ， 而 且 里 层 与 外 层 相 似 ,层次 被 混 到 了 一 起 , 但 
由 于 空间 有 限 ， 我们 不 得 不 使 用 省 略 写 。 这 类 语句 又 被 称 为 自 指 语 句 。 由 这 种 自 指 可 
以 构造 导论 语句 ， 例 如 那个 知名 的 说 诉 者 悖 论 : 


这 和 句 话 是 错 的 。 


所 请 的 怪 论 束 是 指 日 相 矛盾 ,上面 这 人 句 话 就 是 目 相 矛盾 的 。 因为 , 如 末 它 是 错 的 ， 
那么 我 们 会 发 现 这 人 铝 话 的 判断 实际 上 是 对 的 ， 出 现 予 慎 ; 而 如 宁 承 认 它 是 对 的 ， 那 么 
按照 它 目 己 的 说 法 , 它 又 错 了 ,再次 出 现 矛 盾 。 这 样 ， 目 指 怪 论 在 两 个 方面 展现 了 巴 
盾 。 也 就 是 说 ， 这 侣 话 实际 上 不 真 也 不 假 ， 或 者 说 既 真 又 假 。 
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日 指 悖 论 的 出 现 挑战 了 熟悉 的 非 此 即 彼 的 世界 观 。 更 为 奇怪 的 是 , 这 类 看 起 来 很 
充 恋 的 句子 却 为 甫 德尔 定理 的 出 现 和 证 明 埋 下 了 伏笔 。 


哥 德 尔 定理 被 《纽约 时 代 周刊 》 评 选 为 20 世纪 最 有 影响 力 的 数学 定理 ( 没有 之 
一 )。 因 为 它 的 提出 一 度 大 大 动 授 了 人 们 对 于 公理 化 方法 ， 对 于 数学 ， 甚 至 对 于 整个 
科学 的 信心 。 而 另 一 方面 ， 正 是 由 于 哥 德 尔 定理 的 出 现 ， 才 使 得 人 们 以 清醒 的 头脑 认 
识 到 了 自身 的 局 限 性 : 那 种 无 需 直 党 和 先 验 知识 就 能 一 劳 永 逸 地 解决 所 有 数学 问题 的 
公理 化 系统 是 不 可 能 存在 的 。 为 了 获得 真理 ,我们 必须 向 大 自然 学 习 。 我们 下 面 将 介 
绍 哥 德 尔 定理 和 哥 德 尔 证 明 ， 重 点 指出 自 指 与 哥 德 尔 定理 之 间 的 关系 。 


公理 化 系统 

数学 最 大 的 好 人 处 束 在 于 ， 它 可 以 从 一 些 基本 而 人 简洁 的 前 提 假 设 (公理 ) 出 发 ， 通 
过 严密 的 推理 导出 所 有 可 徘 的 结论 一 一 这 就 是 数学 公理 化 方法 。 我 们 中 学 学 到 的 平面 
几何 就 是 一 个 很 好 的 例子 。 

我 们 不 妨 将 一 个 数学 公理 系统 比喻 成 一 堆 多 米 诺 骨 有 牧 ， 如 图 4-7 所 示 。 
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4-7 ”数学 公理 化 系统 的 多 米 诺 骨牌 比喻 
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其 中 每 一 张 骨牌 可 以 比喻 成 一 个 数学 命题 。 那 么 ， 第 一 张 被 推倒 的 骨牌 就 相当 于 
数学 系统 中 的 公理 。 骨 牌 相 互 线 结 排 列 成 一 颗 树 状 结构 比喻 命题 之 间 通 过 逻辑 关系 的 
相互 鲁 结 。 骨 牌 一 个 接 一 个 的 推倒 过 程 就 相当 于 数学 中 的 逻辑 推理 。 被 推倒 的 骨牌 相 
当 于 被 证 实 的 命题 ， 即 数学 中 的 定理 。 

这 个 比喻 形象 而 直观 地 表达 出 了 数学 公理 化 系统 所 具备 的 那 种 机 械 化 的 连续 性 
过 程 。 因 此 ， 我 们 很 容易 形成 这 样 一 种 直觉 : 数学 公理 化 就 是 日 动 化 、 机 械 化 。 它 严 
格 而 精确 ， 但 同时 也 失去 了 生命 力 和 创造 性 。 


希 尔 但 特 纲领 


但 是 ，19 世纪 末 20 世纪 初 的 数学 家 们 却 不 这 么 认为 。 他 们 认为 数 竺 或 者 说 公理 
化 系统 是 人 类 吞 力 发 明 的 最 强 有 力 而 且 最 优 关 的 工具 。 


大 数学 家 大 卫 … 布尔 伯 特 就 是 这 些 理性 派 人 物 中 的 领军 着 。 为 了 让 数学 更 加 严格 
化 , 并 将 公理 化 方法 贯穿 始终 ,他 在 20 世纪 初 提 出 了 乔 尔 伯 特 纲领 4 Hilbert program )， 
号 各 数学 家 们 在 数学 的 各 个 分 支 领域 建立 公理 化 体系 。 除 了 大 力 弘扬 公理 化 方法 以 
外 , 和希 尔 伯 特 纲领 还 有 一 个 更 大 的 野心 : 运用 数学 公理 化 方法 本 里 证 明 数 学 公理 化 方 
法 是 完美 的 。 

具体 来 说 ,一 个 完美 的 数学 系统 应 该 具备 两 个 优 恨 的 品质 : 一 致 性 和 完备 性 。 一 
致 性 就 是 说 这 个 数学 公理 化 系统 中 不 存在 让 盾 。 公 理 系 统 中 不 能 既 推出 三 角形 内 角 和 
等 于 180 度 ， 又 推出 它 大 于 或 者 小 于 180 度 。 


而 完备 性 是 说 ， 如 果 某 个 数学 命题 是 真 的 ， 那么 这 条 命题 就 一 定 能 从 公理 中 推导 
出 来 。 也 就 是 说 ， 公 理化 系统 已 经 涵盖 了 所 有 的 真 命题 。 因 此 ， 要 想 获 得 真知 ， 我 们 
并 不 需要 做 什么 其 他 事情 ， 只 要 在 这 个 超级 的 公理 化 系统 中 不 集 地 推 叶 就 可 以 了 。 只 
要 我 推倒 第 一 张 树 立 的 骨牌 ,就 能 相继 地 让 后 面 的 骨 有 牌 倒 下 ， 从 而 轻松 地 得 到 所 有 的 
数学 真理 。 

如 果 能 够 证 明 一 个 足够 强大 的 数学 公理 体系 是 完备 且 一 致 的 , 那么 一 切 衬 宙 真 理 
已 然 强 藏 在 数学 系统 内 部 ,我们 所 要 做 的 就 是 不 断 地 摆弄 这 个 系统 ,将 这 些 真 理 找到 。 
这 是 希 尔 但 特 的 猜想 。 他 想 做 到 的 是 : 用 这 和 套 公 理化 方法 本 身 证 明 数 学 公理 系统 的 完 
备 一 任性 。 这 束 好 像 一 个 人 要 拔 着 上 自己 的 头发 逃离 地 球 一 样 。 

20 世纪 初 ,数学 家 们 普遍 认为 希 尔 伯 特 纲 领 必然 是 对 的 ， 因为 它 堪 称 完美 。 具有 
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讽刺 意味 的 是 , 这 些 产 狂 的 拥护 者 中 就 有 年 轻 的 数学 家 可 德尔 一 一 这 位 未 来 的 希 尔 伯 
村 纲领 的 掘 莫 人。 下 是 因为 可 德尔 当时 太 看 迷 于 硕 尔 但 特 岗 领 了 ， 所 以 他 才 会 第 一 个 
发 现 它 的 最 大 弱点 ， 给 予 致命 的 一 击 。 


厦 尔 伯 特 纲领 的 最 大 弱点 恰恰 就 是 它 的 目 指 性 : 要 用 数学 公理 系统 本 号 而 不 能 供 
助 其 他 外 力 来 证 明 数 学 公理 的 完备 一 致 性 。 和 在 要 实现 这 一 点 ， 这 个 数学 公理 系统 就 要 
具备 谈论 日 己 的 能 力 。 于 是 ,我 们 便 可 以 在 数 等 公理 系统 中 构造 一 个 悖 论 句 ， 从 而 彻 
左 摊 毁 而 尔 伯 特 的 猜想 。 这 个 数学 公理 系统 中 的 信 论 就 是 册 德 尔 句 子 。 


哥 德 尔 句子 可 以 通俗 地 表述 为 : 
本 数学 命题 不 可 以 被 证 明 。 

这 是 一 条 目 指 语句 ， 有 着 与 说 说 者 上 自 指 迟 论 非常 相似 的 结构 。 首 先 ， 这 个 数学 命 
题 所 讨论 的 对 象 不 是 别 的 ， 恰 恰 是 它 自 己 -“ 本 数学 命题 ”就 是 对 整个 命题 的 指 代 。 
其 次 ， 该 命题 给 出 了 一 个 逻辑 判断 ， 即 这 条 命题 是 不 可 以 被 证 明 的 。 这 个 句子 本 身 似 
乎 并 没有 那么 收 恶 , 然而 只 要 我 们 一 开始 用 逻辑 的 头脑 解读 它 , 它 就 变 成 了 一 人 句 魔 名 ， 
直接 摊 毁 了 和 希 尔 伯 特 的 完备 一 致 性 猜想 。 

下 面 我 们 将 展开 推理 。 根 据 逻 辑 排 中 律 ， 这 条 数学 命题 要 么 正确 ， 要 么 错误 。 那 
么 ,我们 不 妨 先 假设 它 是 正确 的 ， 然 后 再 看 看 会 发 生 人 什么。 于 是 ,“ 本 数学 命题 不 可 
以 被 证 明 ” 就 暂时 是 正确 的 ,也 就 是 说 这 个 数学 命题 是 一 条 数学 真理 ， 并 且 根 据 它 目 
己 的 论述 ， 它 不 能 被 证 明 。 于 是 ,我 们 得 到 了 一 条 真理 ,但 却 不 能 被 我 们 的 数学 公理 
化 系统 所 证 明 ， 因 此 ， 希 尔 伯 特 要 求 的 完备 性 不 能 得 到 保证 。 

下 面 我 们 再 从 男 一 个 角度 展开 讨论 ， 假 设 该 命题 是 不 正确 的 。 那 也 束 是 说 ,， “本 
数学 命题 不 可 以 被 证 明 ” 这 个 命题 是 可 以 被 证 明 的 。 于 是 ， 从 公理 出 发 ， 我 们 能 够 得 
到 “本 数学 命题 不 可 以 被 证 明 ” 这 一 命题 。 而 按照 假定 ,“ 本 数学 命题 可 以 被 证 明 ” 
是 真理 ， 所 以 根据 完备 性 ， 它 也 必然 是 系统 中 的 定理 。 于 是 ， 正 命题 和 反 命题 同时 都 
是 系统 中 的 定理 ， 一 致 性 遭 到 了 破坏 。 

综 上 所 述 ， 我们 可 以 断言 : 对 于 一 个 足够 强大 (强大 到 具备 了 自 指 能 力 ) 的 数学 
公理 化 系统 ， 一 致 性 和 完备 性 不 能 兼 得 。 这 便 是 大 名 易 易 的 哥 德 尔 不 完备 性 定理 ， 简 
称 哥 德尔 定理 。 
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在 哥 德 尔 的 原始 论文 中 ,所 有 的 表述 都 已 经 翻译 成 了 严格 的 数学 语言 。 所 以 ， 经 
过 严密 的 推理 ， 数 学 系统 目 身 指出 了 数学 系统 的 完备 一 致 性 假说 不 成 立 。 


水 恒 的 黄金 对 角 线 


事实 上 , 哥 德 尔 证 明 中 的 关键 一 一 构造 由 德 尔 语句 一 一 恰恰 就 是 数学 中 最 背 名 的 
对 角 线 法 的 一 个 变种 。 而 这 种 证 明 技 巧 最 早起 源 于 数学 家 格 奥 尔格 康 托 尔 ( George 
Cantor ) 对 集合 论 的 研究 ， 他 发 明了 对 角 线 法 以 证 明 实 数 比 自然 数 多 。 因 此 ， 人 们 又 
将 目 指 导论 的 构造 称 为 对 角 线 法 。 

然而 , 数学 家 莱 折 学 家 罗 系 很 快 就 发 现 了 集合 论 中 的 问题 , 他 利用 同样 的 构造 目 指 
导 论 ( 对 角 线 法 ) 的 方法 指出 了 集合 论 的 自 相 矛盾 之 处 。 罗 系 屠 论 的 一 个 通俗 版 本 一 一 
理发 师 迟 论 是 这 样 表 述 的 : 

某 个 小 村 庄 里 有 一 名 理发 师 ， 他 给 自己 制定 了 一 条 奇特 的 规矩 : 他 不 给 
那些 给 自己 理发 的 人 理发 。 


这 条 规矩 看 起 来 没什么 问题 , 但 是 一 旦 我 们 间 这 位 理发 师 他 该 不 该 给 自己 理发 的 
时 候 ， 他 就 会 立即 陷入 目 相交 盾 的 境地 。 因 为 ， 如 东 他 给 目 己 理发 ， 那 么 按照 他 的 规 
算 ， 他 属于 给 日 己 理 发 的 人 ,那么 他 就 不 该 给 日 己 理发 。 而 如 果 他 不 给 目 己 理发 ， 那 
么 根据 他 的 规矩 ， 他 又 应 该 给 目 己 理发 。 所 以 ， 这 个 可 怜 的 理发 师 将 无 所 适 从 。 

到 了 20 世纪 30 年 代 ， 随 春 计 算 理 论 的 兴起 和 不 断 效 入 ， 对 角 线 方法 得 到 了 更 加 
广泛 的 应 用 。 一 个 典型 的 例子 就 是 图 灵 将 这 种 方法 用 于 证 明 若 名 的 图 灵 停 机 问题 不 可 
解 : 即 判定 任意 程序 作用 到 任意 数据 上 是 否 停机 的 程序 是 不 存在 的 《参见 第 2 章 )。 

由 此 可 见 ， 无 论 是 哥 德 尔 定理 、 罗 素 迟 论 ， 还 是 图 灵 保 机 问题 ， 对 角 线 方法 都 发 
挥 着 绝对 核心 的 作用 。 这 条 黄金 对 角 线 仿佛 就 是 亚麻 的 诅咒 ,限定 了 人 类 理性 思维 的 
作用 范围 。 


和 目 生产 系统 与 生命 


至 此 , 我们 所 看 到 的 数学 、 计 算 机 科学 中 的 强 结 层次 结构 总 是 以 导论 的 形式 出 现 ， 
它 市 来 的 永远 是 不 可 能 、 目 相 矛 盾 、 亦 此 亦 彼 。 


但 事实 并 非 如 此 , 缠 结 的 层次 结构 是 一 个 比 日 指导 论 更 大 的 概念 , 怪 论 性 的 目 指 
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仅仅 是 其 中 的 一 部 分 。 另 外 的 一 些 目 指 结构 则 可 能 包含 痢 创 造 和 构建 ， 具 备 很 强 的 积 
极 意义 。 


20 世纪 五 六 十 年 代 ， 两 名 来 和 目 午 利 的 科学 家 温 贝 托 . 马 图 拉 纳 (Humberto 
Maturana ) 和 弗 天 西 斯 科 ' 瓦 瑞 拉 (ErancisoVarela ) 曾 提 出 了 一 个 被 称 为 自我 创 生 
(Autopoiesis ) 的 理论 。 该 理论 指出 , 一 个 活 细胞 在 本 质 上 可 以 看 作 一 个 化 学 反应 物 构 
成 的 生产 网 络 ， 且 这 个 网 络 形成 了 一 个 目 我 财 合 的 轿 ， 即 系统 中 的 任何 反应 物 都 是 被 
该 网 络 中 其 他 反应 物 生成 出 来 的 。 


我 们 可 以 用 一 张 埃 舍 尔 的 画 ( 见 图 4-8 ) 来 表达 这 种 财 合 的 生产 网 络 的 概念 。 这 
是 一 个 最 容 单 的 目 我 财 合 的 生产 网 络 。 网 络 中 仅仅 有 两 个 化 学 反应 物 : 两 只 手 。 而且， 
上 面 的 手 被 下 面 的 手 “ 生 产 ”( 绘制 )， 下 面 的 手 被 上 面 的 手 “ 生 产 ”( 绘制 )。 而 目 创 
生 网 络 是 由 成 千 上 万 的 “ 手 ” 组 成 的 相互 生产 的 复杂 网 络 。 


4-8 《 男 手 》 


这 样 的 闭合 生产 网 络 具有 日 我 维持 和 日 我 修复 的 优 民 特性 。 因 为 只 要 该 网 络 中 的 
少数 几 个 反应 物 存在 ,它们 就 可 以 通过 化 等 反应 生成 系统 中 的 其 他 元 系 。 而 一 旦 系统 
形成 ， 它 不 需要 外 界 的 干预 号 能 日 我 维持 下 去 。 态 外 ， 如 采 我 们 恶意 删除 一 些 化 学 反 
应 产物 节点 ， 只 要 破坏 得 不 够 历 害 ， 那 么 系统 仍然 会 在 其 他 产物 的 驱使 下 逐渐 生成 这 
些 化 学 反应 物 ， 从 而 再 次 生长 出 一 个 完整 的 网 络 整体 ， 这 就 是 我 们 看 到 的 生命 目 修复 
现象 : 在 手 上 划 出 一 道口 子 ， 过 几 天 就 愈合 了 。 
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有 趣 的 是 ， 下 面 这 人 句 日 描述 语句 也 可 以 作为 日 生产 网 络 的 比喻 : 
这 向 话 有 2 个 人 字 ， 2 个 “全 ” 字 ， pe “ 话 ” 字 ， 2 

7 个 So 2 11 个 66 人 

2 个 了 二 


这 人 句 话 的 每 一 个 部 分 部 可 以 比喻 成 一 个 化 学 反应 物 ， 它 们 之 间 相 互 依存 的 逻辑 
(语义 ) 关系 就 形成 了 化 学 生产 网 络 。 该 网 络 具 有 很 强 的 目 我 修复 “意图 "。 事 实 上 ， 
当 你 尝试 写 下 这 个 句子 的 时 候 ， 你 就 会 “被 巡 地 ”将 整个 句子 写 完整 。 这 侣 话 同时 还 
把 化 竺 反应 网 络 中 缠 结 的 层次 结构 表达 出 来 了 。 这 里 相互 缠 结 的 两 个 层次 是 : 化 学 反 
应 的 整个 网 络 和 每 一 个 具体 的 化 学 反应 产物 。 


生命 的 月 复制 


现实 中 的 生命 具备 的 一 种 了 不 起 的 能 力 就 是 自我 复制 : 将 自己 原封 不 动 地 复制 一 
个 副本 出 来 。 这 种 能 力 是 生命 繁衍 生 居 的 基础 ， 也 是 进化 的 前 提 条 件 。 


然而 ,在 信息 时 代 ， 似乎 复制 能 力 没 什么 了 不 起 ,将 一 份 文件 复制 来 复制 去 已 经 
司空 见 惯 了 。 但 是 ， 所 有 这 些 复制 都 需要 侍 助 于 一 个 外 在 的 媒介 。 例 如 ， 当 我 们 复制 
文件 的 时 候 ， 实 际 上 是 复制 程序 将 磁盘 上 的 数据 完成 了 一 次 复制 ， 而 并 不 是 复制 程序 
月 身 的 复制 ， 因 此 这 不 能 算 作 自 复制 。 真正 的 自 复 制 是 该 程序 完全 不 依靠 外 界 ， 执 行 
它 的 时 候 ， 它 就 会 扫描 上 自己 并 制作 出 为 外 一 份 一 模 一 样 的 副本 。 


这 对 于 一 段 程序 来 说 似乎 是 不 可 能 的 。 假 如 你 就 是 那个 程序 ， 那么 ,如 果 你 要 复 
制 目 己 的 话 ， 就 需要 扫描 你 吴 体 上 的 所 有 细胞 的 状态 ,这 当然 就 包含 了 执行 扫 摘 的 眼 
睛 细胞 和 脑 部 神经 细胞 的 状态 。 但 是 ， 你 的 眼睛 细胞 和 脑 细 胞 如 何 扫描 它们 目 己 呢 ? 
这 就 好 像 让 你 的 眼睛 看 到 眼睛 它 日 己 一 样 ， 这 是 不 可 能 的 ! 


然而 , 通过 一 种 建构 型 的 日 指 方法 , 我们 的 确 可 以 写 出 这 样 的 自我 复制 程序 ， 从 
而 绕 开 上 述 的 自 相 矛盾 。 例 如 ， 下 面 这 上段 代码 就 是 GEB 一 书 中 给 出 的 日 我 打印 程序 
(将 程序 源码 复制 在 屏幕 上 ) 的 源 代码 : 


DEFINE PROCEDURE "ENIUQ" [TEMPLATE 1] : 
PRINT [TEMPLATE, LEFT-BRACKET, QUOTE-MARK, TEMPLATE, QUOTE-MARK, 
RIGHT-BRACKET, PERIOD 


ENIUOL 'DEFINE PROCEDURE "ENIUO" [TEMPLATE|]: PRINT [TEMPLATE, LEFT-BRACKET, 
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OUOTE -MARK ， TEMPLATE, EUOTE-MARK, RIGHT-BRACKET, PERIOD| .ENIUO ' | 
该 代码 采用 的 是 一 种 类 FORTRAN 语言 , 它 分 为 两 部 分 。DEFINE.. 这 部 分 实际 上 
定义 了 一 个 子 程序 , 名 称 叫 作 “ENIUQ”, 它 的 作用 就 是 打印 PRINT 后 面 的 那些 指令 。 
另外 , 下面 ENIUQ['…'] 就 是 对 过 程 ENIUOQ 的 调用 , 传人 的 字符 串 就 是 上 面 定 义 的 函 
数 的 源 代码 。 


如 果 你 能 恋 公 这 段 代码 就 会 发 现 ,实际 上 , 它 的 工作 原理 和 下 面 这 个 不 包含 指示 
代词 “这 ”的 目 指 语句 很 类 似 : 


把 “把 中 的 第 一 个 字 放 到 左 引号 前 面 ， 其 余 的 字 放 到 右 引 号 后 面 ， 并 保 
持 引 号 及 其 中 的 字 不 变 ” 中 的 第 一 个 字 放 到 左 引 号 前 面 ， 其 余 的 字 放 到 右 引 
号 后 面 ， 并 保持 引号 及 其 中 的 字 不 变 。 


请 仔细 阅读 这 个 句子 ,并 严格 按照 句子 要 求 你 做 的 事情 去 操作 。 该 句子 希望 你 把 
引号 中 的 句子 拆 开 ， 把 “把 ” 字 放 到 最 前 方 ， 其 余 放 到 引号 后 面 ， 然 后 保持 引号 中 的 
文字 不 变 。 你 就 会 发 现 ， 你 的 误 出 来 的 新 句子 就 是 原始 句子 本 吴 。 而 这 个 时 候 ， 你 会 
发 现 ， 这 句 话 的 意思 实际 上 就 已 经 清晰 地 表达 出 了 你 正在 做 的 事情 。 

这 实际 上 是 一 种 新 的 实现 目 指 的 方法 ， 因 为 它 没 有 使 用 指示 代词 “这 ” 束 实 现 了 
自 指 。 在 GEB 书 中 ,这 种 方法 被 称 为 前 (kuii ) 恩 ， 以 纪念 美国 著名 的 逻辑 学 家 齐 恩 
( W.V. Quine )。 该 方法 的 奥秘 在 于 它 巧 妙 地 利用 了 使 役 动词 “把 ”而 对 原始 句子 进行 
操作 ,使 得 到 的 新 句子 刚好 跟 原 句 子 重 合 ， 从 而 完成 了 间接 的 目 我 指 涉 。 我 们 不 妨 用 


图 4-9 来 表示 O 
~ 
原始 句子 时 操作 所 得 到 的 新 句子 
相同 


4-9 间接 的 自 指 技术 
原始 句子 所 指 涉 的 对 象 本 质 上 不 是 它 目 己 , 而 是 通过 解 谈 者 的 操作 而 得 到 的 新 名 
子 ， 但 有 意思 的 是 ， 这 个 新 句子 刚好 跟 原始 句子 一 梗 一样 。 这 样 ， 缠 结 的 层次 结构 就 
出 现 了 。 
那个 日 复制 的 程序 其 实 也 可 以 分 成 两 个 部 分 , 一 个 部 分 是 对 菏 一 段 代码 ( 并 不 是 
全 部 ) 原封 不 动 的 复制 ， 第 二 部 分 则 是 通过 该 取 、 操 作 得 到 的 部 分 新 代码 ， 构 建 出 一 
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个 完整 的 新 程序 出 来 ， 这 就 完成 了 整个 程序 的 目 我 复制 。 


通俗 地 说 , 如 果 你 要 执行 目 我 复制, 那么 你 需要 做 的 就 是 复制 你 号 体 的 部 分 信息 ， 
然后 根据 这 部 分 信息 ， 构 造 出 一 个 新 的 整体 。 事实 上 ,在 生物 学 意义 上 ， 这 部 分 信息 
就 是 生命 的 DNA 编码 ， 而 根据 编码 构造 整体 的 过 程 就 是 集 日 质 的 合成 。 所 以 ,现实 
的 生命 日 复制 过 程 其 实 就 实现 了 间接 的 目 指 。 


伟大 的 数学 家 冯 : 诺 依 曼 在 他 生命 的 最 后 阶段 将 全 部 精力 都 花 在 了 人 研究 日 复制 
目 动机 的 人 研究 中 。 他 不 仅 设计 出 来 一 个 繁复 的 元 胞 日 动机 模型 (一 种 离 若 的 计算 机 
模型 ， 如 图 4-10 所 示 ) 来 研究 程序 的 目 复 制 问 题 ， 而 且 还 和 希望 通过 这 个 模型 理解 生 
命 是 如 何 利用 前 恩 技 术 实现 抵制 箭 增 定 律 的 。 他 观察 到 ， 当 系统 的 复杂 性 超过 一 定 
的 级 别 〈 具 备 了 前 恩 形 式 的 目 指 )， 就 可 以 实现 复杂 性 不 断 升 级 的 进化 ， 而 不 再 是 在 
烂 增 定律 下 了 未 渐 肥 败 下 去 。 冯 … 诺 依 曼 称 这 是 “概率 论 中 的 一 个 源 洞 "， 因 为 随机 碰 
撞 的 分 子 网 络 本 来 具有 很 小 的 成 功 概 率 ， 但 是 一 旦 分 子 伴 撞 出 来 一 个 贿 恩 目 指 ， 那 
么 ， 它 就 可 以 不 断 地 繁殖 下 去 ， 从 而 使 小 概率 事件 成 为 大 概率 的 生命 存在 。 


a 
即将 建造 的 自动 
机 已 完成 的 部 门 


B 

付 守 即将 建造 的 自动 | 

乔 守 机 未 完成 的 部 门 |， 
(X60,7o) 国 守 一 一 一 一 一 一- 2 


构建 控制 
(未 按 真实 比例 绘画 ) 


:Mb, 入 oo | 入 ao-i.p8- 


纸 带 控制 十 全 
(未 按 真实 比例 绘画 ) TEN 
国 本 芹 纸 带 


悦 荆 厘 沾 


| 
| 


图 4-10 ”为 诡 依 曼 的 自 复制 自动 机 模型 示意 图 
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目 指 与 意识 


人 工 和 留 能 的 终极 目标 就 是 要 创造 出 一 个 具有 日 我 意识 的 机 带 。 尽管 这 样 的 机 带 还 
远 没 有 问世 ,但 是 我 们 不 妨 通过 考察 人 类 日 映 的 日 我 意识 来 洞悉 其 中 的 奥妙 。 


意识 束 仿 佛 是 一 面 借 于 ,可 以 映照 其 他 一 切 事物 ， 包括 我 们 生存 的 物理 环境 ， 也 
包括 车 识 目 嘻 。 当 我 们 醒 来 的 时 候 ,， 我 们 的 鞋 识 就 会 明日 无 误 地 体会 到 音 识 目 映 的 存 
在 。 因 此 ， 晶 指 恰 恰 就 是 目 我 意识 的 一 个 最 重要 的 属性 。 


不 仅 如 此 ,日 我 意识 的 核心 就 是 日 我 。 日 我 并 不 是 我 所 观察 到 的 外 在 事物 ， 而 就 
是 这 个 观察 、 意 识 本 身 。 所 以 ,我 的 号 体 、 我 的 记忆 甚至 我 的 感受 都 不 等 同 于 我 ， 真 
正 的 我 恰恰 不 是 所 有 这 些 有 形 的 东西 ， 而 是 体察 、 认 识 这 些 有 形 东西 自身 的 能 力 。 


我 们 可 以 用 GEB 书 中 提 到 的 一 个 非常 有 趣 而 简单 的 实验 来 说 明 意 识 本 里 的 属性 。 
我 们 可 以 找 来 一 台电 视 机 和 一 台 摄 像 机 ,然后 把 摄像 机 的 视频 输出 与 电视 机 的 视频 输 
入 连接 到 一 起 。 同 时 ,我 们 把 摄像 机 的 镜头 对 准 电视 屏 硕 ， 并 让 电视 屏 友 实 时 地 播放 
援 像 机 所 拍摄 的 内 容 , 如 图 4-11 所 示 。 集 吞 俱乐部 置 专门 组 织 过 一 系列 的 活动 来 午 复 
这 个 实验 ， 观 看 实验 视频 ,请 扫 下 方 二 维 人 码 。 


允 
摄像 机 . 3 电视 机 /屏幕 
一 


4-11 摄像 机 -电视 自 指 实验 示意 图 


当 我 们 将 摄像 机 对 准 电 视屏 者 的 时 候 ， 会 看 到 一 个 无 穷 延伸 的 走 太 ， 没 有 尽头 。 
屏幕 的 中 心 会 出 现 一 个 模 模糊 糊 、 忽 隐 灸 现 的 亮点 。 这 就 仿佛 两 面 镜子 相互 对 着 照 ， 
可 以 得 到 一 个 无 穷 延伸 的 空间 ( 如 图 4-12 所 示 )。 
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图 4-12 《 咨 梦 空间 》 中 的 画面 : 两 面 镜 子 对 照 得 到 的 无 穷 延伸 空间 


但 是 有 趣 的 事情 还 在 后 面 ,在 摄像 机 上 有 一 个 放大 ( zoom in ) 或 缩小 (zoom onut ) 
的 旋钮 ， 我 们 旋转 到 放大 方向 ， 就 会 将 镜头 前 面 的 事物 拉 近 。 于 是 ,我 们 便 可 以 对 准 
屏 锅 中 心 的 那个 腕 点 放大 它 。 这 个 时 候 ， 我 们 束 会 在 屏幕 上 看 到 一 系列 异 帝 壮观 而 神 
奇 的 结构 。 它 们 有 的 仿佛 不 断 绽放 的 花 打 ， 有 的 则 像 是 旋转 的 星系 朝 我 们 扑 来 ， 有 的 
则 像 是 物体 从 高 空 坠落 到 一 个 绵延 伸展 的 海岸 线 上 。 更 有 意思 的 是 ， 用 不 同 的 摄像 机 
或 屏幕 来 做 这 个 实验 ， 会 得 到 不 同 的 花纹 。 目 我 意识 就 仿佛 是 一 对 相互 映照 的 设备 ， 
在 本 无 一 物 的 虚空 中 生成 了 各 种 大 量 的 复杂 结构 。 


有 过 归 定 理 


人 类 智能 的 最 高 层次 就 是 这 种 具有 目 我 觉 知 或 日 我 反省 能 力 的 意识 了 。 尽 省 这 种 
具备 自我 觉 知 能 力 的 程序 还 没有 实现 ， 但 这 并 不 代表 我 们 原则 上 做 不 到 。 有 趣 的 是 ， 
计算 理论 先驱 者 们 很 早 就 已 经 指出 了 这 种 具有 目 我 党 知 能 力 的 程序 存在 的 可 能 性 , 其 
至 已 经 发 现 了 相关 的 数学 定理 : 克 林 尼 (Kleene ) 递归 定理 。 该 定理 是 这 样 表述 的 : 


对 于 任意 的 程序 了 ， 总 存在 一 段 程序 代码 c， 使 得 我 们 执行 代码 c 的 结 
果 完 全 等 价 于 把 源 代码 c 作为 数据 输入 给 程序 下 执行 的 结果 。 


这 个 定理 看 起 来 非常 平常 , 但 它 对 于 实现 自 指 甚至 自我 觉 知 程序 具有 异常 重要 的 
作用 ， 因 为 该 定理 保证 了 一段 程序 可 以 计算 出 关于 这 段 程序 自身 的 各 种 属性 。 

例如 ， 假 设 程序 Fo 是 求 任何 一 段 字符 串 x 的 长 度 的 程序 ， 那 么 根据 递归 定理 ， 
存在 一 个 有 趣 的 程序 c(F)， 使 得 执行 c(F) 的 结果 就 相当 于 F(c)， 即 计算 得 出 了 程序 
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c 目 己 源 代码 的 长 得。 所 以 ， 程 序 能 够 知道 目 己 源 代 码 有 多 长 。 


再 比如 ， 设 F(x) 表 示 的 是 打印 字符 串 x 的 程序 。 那 么 ,根据 递归 定理 ， 和 存在 看 一 
个 程序 c(F)， 使 得 执行 cP) 的 结果 就 是 把 c 目 己 的 源 代码 打印 了 出 来 。 


实际 上 ， 前 面 讨 论 的 目 我 复制 的 程序 也 可 以 通过 应 用 递归 定理 制造 出 来 。 设 F(x) 
为 根据 源 代码 x 编译 出 x 所 对 应 的 实体 程序 ， 那么 根据 递归 定理 ,存在 这 样 一 段 源 代 
码 c(F)， 使 得 执行 c 的 结果 就 相当 于 根据 源 代 码 c 而 构造 出 了 它 上 自己 ， 于 是 机 融 完成 
丁目 我 复制 的 过 程 。 

总 之 , 利用 递归 定理 ,我 们 可 以 制造 出 可 以 任意 摆弄 目 己 源 代码 的 程序 。 这 就 好 
像 一 个 人 可 以 打开 目 己 的 头脑 对 里 面 的 神经 网 络 进行 任意 的 摆弄 一 样 。 事 实 上 ， 计 算 
机 病毒 就 是 这 样 的 程序 ， 它 们 不 仅 可 以 日 我 复制 ， 而 且 在 一 定 程度 上 还 能 日 我 升级 。 


目 省 程序 


根据 递归 定理 ,我 们 完全 可 以 写 出 具有 上 自省 、 目 我 觉 知 能 力 的 程序 。 首 先 ， 我 们 
知道 ,存在 看 这 样 一 种 计算 机 程序 F(x)， 它 的 作用 就 是 计算 任意 的 源 代码 为 x 的 程序 
在 经 过 1 时 间 步 的 运算 后 的 结 琳 。 通 用 图 录 机 的 工作 原理 就 与 这 个 F(X) 类似 ， 因 为 U 
可 以 模拟 任意 程序 的 运作 。 所 以 ，Fi(x) 的 确 是 一 个 实 实 在 在 的 可 计算 的 程序 。 这 里 的 
! 可 以 看 作 是 给 定 的 参数 , 因此 F, 仅 仅 具 有 一 个 日 变量 , 这 就 是 源 代码 x。 于 是 根据 递 
归 定 理 , 我 们 便 知 道 , 存在 着 一 个 源 程序 O, 它 所 做 的 就 是 : 把 自己 的 源 代码 拿 出 来 ， 
然后 在 目 己 的 虚拟 机 上 模拟 目 己 运算 1 时 间 步 后 的 结果 。 


等 等 , 所 有 的 程序 不 避 是 根据 目 己 的 源 代码 执行 大 干 步 后 给 出 输出 的 吗 ? 那 么 这 
样 一 个 特殊 的 程序 O 又 有 什么 特别 之 处 呢 ?” 这 里 的 关键 就 在 于 O 的 执行 会 在 两 个 层 
面 上 发 生 。 第 一 个 层面 是 0 的 实际 运算 结果 ,这 只 有 当 我 们 实际 运行 这 个 程序 的 时 候 ， 
才 会 看 出 来 。 为 外 一 个 层次 是 指 程序 的 输出 结 琳 。 一般 的 程序 输出 的 结 末 不 会 跟 它 的 
运行 表现 相 一 致 ， 但 是 这 个 独特 的 程序 却 不 同 ， 它 的 输出 和 表现 完全 一 致 。 


如 朱 你 还 不 能 理解 上 面 的 话 ， 那 么 我 们 可 以 把 这 个 程序 比喻 成 人 。 人 会 说 话 ,但 
是 他 所 说 的 话 并 不 总 与 他 的 行为 表现 相 一 致 。 而 人 具有 目 我 意志 ， 他 完全 可 以 做 到 这 
一 点 : 说 出 来 的 话 和 做 出 来 的 动作 完全 一 致 。 同 样 的 直 理 ， 一 般 的 程序 也 仅仅 能 做 出 
和 目 己 的 输出 不 一 致 的 行为 ， 但 是 这 个 目 省 的 程序 O 却 能 够 做 到 言行 一 致 。 这 说 明 ， 
该 程序 上 共有 日 我 觉 知 能 力 。 
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既然 目 我 党 知 是 人 类 意识 中 最 核心 的 能 力 , 那么 这 样 一 种 目 省 的 程序 已 经 可 以 把 
这 种 核心 能 力 复制 出 来 了 。 遗 憾 的 是 ， 虽 然 理 论 上 目 省 程序 完全 能 够 构造 出 来 ， 但 就 
笔者 所 知 ， 还 没有 人 能 真正 把 它 造 出 来 呢 。 这 也 许 是 一 个 值得 实践 答 试 的 事情 。 


强烈 推荐 谈 者 能 亲自 阅读 和 感受 《 哥 德 尔 、 艾 舍 尔 、 巴 赫 : 集 异 壁 之 大 成 》 这 
本 奇 书 。 另 外 ， 关 于 目 指 ， 推 荐 读者 阅读 我 写 过 的 一 篇 科普 文章 :《 目 指 : 连接 图 形 
与 衬 底 的 金 带 》 一 文 。 关 于 目 创 生理 论 ， 请 读者 参考 Selfjproducing Systems- 
Jmplications and Applications of 4xtopoiesigs。 关 于 目 复制 程序 ， 请 谈 者 参考 汉 “ 诺 依 
曼 的 巨著 : Theory of Self-reproducing 4utomata 一 书 ， 尤 其 值得 阅读 的 是 该 书 的 前 $ 
草 ， 集 智 俱乐部 的 东方 和 尚 已 经 把 这 部 分 全 部 翻译 成 了 中 文 。 关 于 递归 定理 ， 请 参 
芳 Computability: An Introduction to Recursive Function Theory 一 书 。 男 外 ， 集 智 俱 乐 
部 曾 举 办 过 关于 生命 的 目 复制 的 活动 ， 观 看 活动 视频 请 扫 下 方 二 维 码 。 
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1956 年 磊 , 麦卡锡 、 闵 斯 基 、 西 索 、 纽 厄 尔 、 香 农 、 索 洛 英 诺 夫 等 人 召开 了 为 期 
一 个 月 的 达 特 茅 斯 会 议 ， 这 标志 着 人 工 智 能 的 正式 诞生 。 起 初 ， 人 工 智能 专家 们 野心 
盈 动 ， 试图 创造 出 不 逊 于 人 类 智力 水 平 的 智能 机 帮 。 但 随后 人 工 智 能 的 每 一 个 新 浪潮 
都 经 历 了 从 盲目 乐观 到 彻底 洱 丧 的 轮回 。 通 用 问题 求解 器 、 感 知 机 技术 、 基 于 规则 的 
专家 系统 、 遗 传 算法 、 神 经 网 络 、 概 率 图 模型 、 文 持 癌 量 机 ， 英 不 如 此 。 目 20 世纪 
70 年代 开始 , 除了 少数 人 仍 在 坚持 传统 外 ， 主流 人 工 智 能 界 已 变 得 越 来 越 意 愤 ， 目标 
也 开始 转移 ， 主 要 人 致力 于 针对 某 种 ( 或 某 类 ) 特殊 问题 、 特 殊 功 能 、 特 殊 领 域 设计 算 
法 问题 求解 。 这 完全 胶 离 了 人 工 智能 先驱 如 图 灵 、 麦 卡 锡 、 凡 斯 其 、 西 壹 等 人 的 预期 
规划 。 闵 斯 基 甚 至 说 :“ 人 工 智 能 的 研究 从 70 年 代 开 始 已 经 “ 脑 死亡 ”了 。 ”现实 环 
境 千 差 万 别 , 纷繁 复杂 ， 由 人 对 每 种 环境 设计 具体 算法 ， 这 种 工作 什么 时 候 是 尽头 ? 
针对 特定 领域 设计 的 算法 是 否 具 有 足够 强 的 泛 化 能 力 , 是 否 能 够 灵活 地 迁移 到 其 他 环 
境 并 迅速 适应 ?” 针对 不 同 功 能 ( 甚至 是 采用 完全 不 同 的 技术 ) 设计 的 不 同 算法 能 够 进 
行 协调 整合 吗 ? 如 有 果 能 ,应 该 如 何 整合 ”有 没有 可 能 设计 一 种 能 够 对 各 种 环境 、 各 种 
目的 迅速 适应 并 作出 反应 、 处 理 信息 、 达 成 目的 的 智能 主体 ”? 


经 过 半 个 世纪 的 发 展 ， 随 看 人 工 箱 能 各 个 子 领 域 的 技术 积累 日 狐 成 辑 ， 大 约 从 
2004 年 开始 ， 以 “通用 性 ”为 目标 的 通用 人 工 知 能 (Artificial General Intelligence ) 开 


全 W 
章 恬 尖 。 


2005 年 , 雷 . 库 效 韦 尔 提出 了 他 的 奇 点 理论 , 他 相信 技术 进步 的 指数 速度 不 会 聂 
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减 ， 并 据 此 对 人 工 智 能 的 未 来 作出 了 极度 乐观 的 预测 ， 这 引起 了 广大 民众 对 通用 人 工 
智能 的 关注 。 

在 学 术 和 领域， 无论 是 在 工程 实践 方面 ， 还 是 理论 创新 方面 ， 新 的 进展 不 断 出现 。 
尤其 最 近 ，DeepMind 公司 把 深度 学 习 和 加 强 学 习 结 合 了 起 来 ， 用 深度 学 习 编码 特征 ， 
用 加 强 学 习 寻 找 策略 ， 在 Stella 模拟 机 上 让 机 器 自己 玩 Atari 2600 的 游戏 ， 结 果 不 仅 
在 很 多 游戏 上 战胜 了 其 他 机 需 , 甚至 战胜 了 专业 的 游戏 高 手 。 这 显示 了 一 定 的 通用 性 ， 
但 它 只 针对 Atari 2600 上 的 简单 游戏 ， 并 对 这 一 类 游戏 做 了 很 多 预 处 理 ， 所 以 离 真正 
的 通用 智能 仍然 很 遥远 。 


如 此 众多 的 方案 各 自 为 战 , 虽然 工程 实践 上 互相 借鉴 , 但 理论 方面 各 有 自己 的 体 
系 ， 归 根 到 底 是 对 “智能 ”本 里 的 理解 不 同 。 抽 象 的 “智能 ”是 个 很 难 精确 定义 的 复 
森 概 念 。 笼 统 地 说 ， 人 的 智能 涉及 模式 识别 、 分 类 、 和 学习、 记忆、 归纳、 类比 、 泛 化 、 
联想 、 规 划 、 优 化 、 创 新 、 演 绎 推理 、 问 题 求解 、 语 言 处 理 、 和 生存、 繁衍 等 方面 ， 试 
图 通过 模拟 人 脑 或 模拟 人 类 智能 的 各 种 功能 模块 而 构建 智能 主体 , 可 以 看 作 一 种 自 下 
而 上 实现 人 工 千 能 的 方式 。 那 么 有 没有 一 种 目 上 而 下 的 方式 ? 比如 从 全 局 出 发 对 智能 
的 研究 自动 包含 具体 的 功能 模块 ， 或 使 各 种 “智能 表象 ”自动 涌现 出 来 ? 抽象 地 看 ， 
智能 主体 是 能 够 成 功 实现 某 种 “目标 ”的 主体 ， 或 者 是 能 够 在 各 种 未 知 的 环境 中 成 功 
获取 “最 大 效用 ”的 主体 。 但 “效用 ”是 什么 ? 

如 何 最 大 化 ?对 于 未 知 的 环境 如 何 估 测 和 适应 ?各 种 可 能 的 环境 有 哪些 ? 有 没 
有 一 个 能 在 各 种 可 能 的 环境 中 表现 最 优 的 “最 智能 ”的 主体 ? 

2005 年 ,通用 人 工 智能 领域 的 代表 人 物 马 库 斯 . 胡 特 -第 一 次 给 出 了 真正 能 适应 
各 种 不 同 环境 的 通用 智能 主体 的 自 上 而 下 的 、 严 格 形式 化 的 、 可 靠 的、 通用 的 、 无 参 
数 的 数学 模型 ， 称 为 AIXI， 而 且 只 用 了 下 面 一 个 公式 : 


0, := arg max > max >》， [7 +...+r,] > 9 (AIXD) 
人 our Om op, giU (qs0 0, )=017 OP 

通过 AIXI, 上 面 提 到 的 难题 都 可 以 得 到 某 种 解释 。 虽然 AIXI 本 喘 是 不 可 计算 的 ， 
但 是 ， 在 事先 不 告知 具体 游戏 规则 的 情况 下 ， 即 使 对 于 AIXI 的 某 种 可 计算 的 简单 变 
种 MCAIXI-CTW'“， 它 仍然 可 以 完全 通过 试 错 法 总 结 学 习 规 则 ， 玩 好 Cheese Maze、 
TicTacToe、Pacman 、Kuhn Poker 等 各 种 小 游戏 。 胡 特 本 人 将 AIXI 看 作 通 用 人 工 智能 
的 “黄金 标准 ”或 指 路 明灯 。 经 过 这 些 年 的 发 展 ，AIXI 甚至 变 成 了 希 巴 德 、 尤 德 考 斯 
基 等 人 研究 人 工 智能 伦理 的 理论 基础 。 如 此 强大 的 智能 青 后 究竟 隐藏 看 什么 女 机 ? 下 
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面 就 让 我 们 一 步 步 揭 开 通用 智能 模型 AIXI 的 神秘 面纱 。 


衣 特 的 通用 智能 模型 AIXI 的 核心 是 索 洛 更 诡 夫 的 通用 归纳 模型 ， 事 实 上 ， 将 索 
治 更 谢 夫 的 通用 归纳 与 序 贵 决 策 理论 相 结合 就 得 到 了 通用 智能 模型 AIXI。 序 贯 决 傈 
理论 研究 的 是 在 客观 概率 分 布 已 知 但 具体 状态 不 确定 的 动态 环境 中 , 主体 如 何 寻 求 最 
大 化 期 望 效 用 。 它 从 初始 状态 开始 , 每 个 时 刻 根据 所 观察 到 的 状态 和 以 前 状态 的 记录 ， 
依照 已 知 的 概率 分 布 , 从 一 组 可 行 方案 中 选用 一 个 能 够 获得 最 大 化 期 望 效用 的 最 优 方 
案 ， 接 着 观察 下 一 步 实 际 出 现 的 状态 ， 然 后 再 作出 新 的 最 优 决 策 ， 如 此 反复 进行 。 但 
最 关键 的 问题 是 ， 如 采 这 种 客观 的 概率 分 布 未 知 怎么 办 ? 这 时 我 们 能 否 依 助 茶 种 “ 主 
观 ”概率 代 符 “客观 ”概率 ， 然 后 在 这 种 “主观 ”概率 下 寻求 期 望 效用 最 大 化 ? 这 恰 
恰 是 和 洛 莫 诡 夫 的 “算法 概率 ”大 显 号 手 的 地 方 。 那 么 ，“ 算 法 概率 ” 完 葛 是 何方 神 
圣 呢 ? 顾名思义 ， 它 是 茶 种 与 算法 相关 的 概率 ， 可 概率 又 是 怎么 与 算法 扯 上 关系 的 
呢 ? 我 们 知道 ， 如 果 已 知 信 源 的 概率 分 布 ， 那 么 可 以 设计 有 茶 种 使 得 期 望 码 长 最 短 的 最 
优 码 ， 比 如 霍 夫 受 码 。 党 统 地 说 ， 这 是 通过 对 局 概 率 事件 赋 子 短 编 权 、 对 低 概 率 事 件 
赋 子 长 编码 实现 的 ， 而 算法 完全 可 以 理解 为 其 “输出 ”的 “编码 ”。 如 果 我 们 把 借助 
已 知 概 座 设 计 最 优 码 的 过 程 反 过 来 ,设想 首先 知道 的 不 是 概 座 而 是 编码 (算法 ) ， 那 
么 束 可 以 通过 算法 反 辣 诱 导出 菏 种 主观 概 座 , 然后 对 所 有 可 能 的 算法 诱导 出 的 所 有 可 
能 的 主观 概率 进行 加 权 平 均 ， 就 得 到 了 和 肝 洛 莫 诡 夫 的 “算法 概率 ”。 但 为 什么 这 种 把 
堆 夫 受 编 权 思 想 反 过 来 泛 导出 的 概率 会 有 用 呢 ? 因为 科学 是 压缩 的 艺术 , 简单 性 是 科 
党 的 基本 假设 ,探索 世界 育 后 的 运行 模式 就 是 在 寻找 侧 单 的 算法 。 把 短 的 算法 赋 子 高 
的 概率 诱导 出 的 是 一 种 对 各 种 可 能 世界 或 猪 想 的 “ 先 验 信念 ”。 这 体现 的 正 是 奥 卡 姆 
刹 思 的 简单 性 哲 竺 ,而 算法 概率 正 是 综合 权衡 了 各 种 可 能 的 算法 诱导 出 的 各 种 可 能 的 
主观 概率 。 归纳 是 一 个 不 断 试 错 的 学 习 过 程 ,算法 概率 使 得 我 们 可 以 根据 经 验 不 断 “ 修 
正信 念 ”、 通 近 “ 真 理 ”。 有 了 算法 概率 做 武 表 ， 上 册 仿 助 序 贯 决 生 理 论 帮 助 我 们 追逐 
效用 ， 能 够 目 动 适应 各 种 可 能 环境 的 超级 智能 体 AIXI 就 诞生 了 。 


简 言 之 ,通用 智能 的 核心 是 通用 归纳 。 通 用 归纳 将 归纳 转化 为 预测 ， 而 预测 的 天 
键 是 压缩 。 压 缩 可 以 理解 为 对 数据 的 建 模 或 编码 表示 ， 它 依赖 于 对 模式 的 擎 握 ， 模 式 
可 以 用 算法 来 衡量 。 从 数据 到 程序 是 编码 ， 从 程序 到 数据 则 是 解码 。 编 码 越 好 ( 即 压 
顷 越 短 ) 则 预测 越 准 ， 预 测 越 准 行为 就 越 有 效 。 与 智能 相关 的 其 他 要 系 ， 诸 如 分 类 、 
类 比 、 联 想 、 泛 化 等 阁 可 以 理解 为 对 模式 的 追求 ， 这 些 虱 可 以 在 追求 最 大 压 纳 的 过 程 
中 涌现 出 来 ， 所 以 不 是 基本 的 。 但 找寻 最 短 编码 的 过 程 不 是 一 个 能 行 的 过 程 ， 所 以 我 
们 只 能 通过 试 错 不 断 逼 近 。 通 近 的 过 程 可 以 理解 为 一 个 信念 修正 的 过 程 ， 这 可 以 通过 
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贝 叶 斯 更 新 来 处 理 , 信念 修 正之 前 的 “ 先 验 信念 ”的 大 小 则 取决 于 模式 目 喘 的 简单 性 。 

上 面 是 对 通用 智能 模型 AIXI 及 其 核心 一 一 通用 归纳 的 简单 介绍 ， 下 面 我 们 详细 
展开 。 索 洛 喘 诺 夫 把 归纳 问题 转化 为 序列 预测 问题 ， 而 不 是 归纳 出 某 个 具体 的 模型 。 
序列 预测 问题 是 最 稼 见 的 智商 测试 题 型 , 痛 先 , 让 我 们 从 几 道 常见 的 和 多 两 测试 题 说 起 。 


几 过 数字 推理 题 


万 物 恬 数 。 


人 1,3,5,7,9,11,13,15,?) 

(ii 0,1.0,1.0,1.0,1.0,(9) 

(iiD 1,1,2,3,5,8,13,21,(9) 

(iv) 1,4,1,5,9,2,6,5,3,(?) 

(Vv) 12,23,35,47,511,613,(?) 

(vi) (7111,0), (8809,6), (2172,0), (6666,4), (1111,0), (2222,0), (7662,2), (9313,1), 

(0000,4), (8193,3), (8096,5), (4398,3), (9475,1), (0938,4), (3148,2), (2889,?) 

直观 上 ， 前 4 个 问题 都 比较 简单 ， 只 要 能 够 识别 出 给 定数 列 背 后 的 递 推 公式 ， 后 
面 的 数位 就 可 以 “能 行 ” 地 计算 出 来 。 这 是 一 个 先 归 纳 再 预测 的 过 程 ， 虽然 最 后 的 目 
的 是 准确 预测 下 一 位 数字 ,但 最 关键 的 步骤 是 归纳 出 预期 的 递 推 公式 。 这 里 涉及 两 个 
核心 要 素 : 预先 给 定 的 数列 (现象 ) 、 待 佑 的 递 推 公式 (模型 ) 。 归 纳 推理 就 是 这 种 
从 现象 到 规律 〈 模 型 、 假 设 ) 、 从 混沌 到 有 序 、 从 结果 到 原因 的 过 程 。 下 面 一 起 看 看 
这 6 道 题 的 参考 答案 吧 。 

人) 17 

奇数 列 。 

(ii) 1 


0,1 交替 。 


(Giii) 34 
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起 流 那 契 数 列 。 

(1v) 5 

圆周 率 小 数 点 后 的 数位 。 

(V) 717 

数位 拆 分 ， 第 一 位 目 然 数 序列 ， 后 面 则 为 素数 列 。 

(v1) 5 

数 “ 圈 圈 ”的 个 数 。 

数列 〈 现象 ) 是 初始 给 定 的 ， 所 以 真正 需要 我 们 目 己 解决 的 是 一 一 怎么 找到 那个 
递 推 公式 (“能 行 ”的 “模式 ”) ? 

但 先 不 急 着 找 递 推 公式 ， 因为， 在 开始 寻找 递 推 公式 之 前 ,我 们 忽视 了 一 个 比较 
哲学 的 问题 , 那 就 是 归纳 推理 能 保证 确定 性 吗 ? 以 问题 四 为 例 , 奇数 列 通 项 公式 2n-1 
是 我 们 想 要 的 递 推 公 式 ， 可 是 不 难 发 现 ， 下 面 这 个 递 推 公式 也 满足 给 定 的 数字 串 。 


8 
27-1+ | | 一 
1 一 | 


多 个 “模式 ”符合 同一 系列 “现象 ”， 这 该 如 何 取 舍 呢 ? 


奥 卡 姆 利 刀 一 一 哲学 那 论 ? 还 是 科学 方法 论 ? 
如 无 必要 ， 勿 增 实体 。 
一 一 奥 卡 姆 

通过 这 几 着 智商 测试 题 我 们 看 出 ， 要 解决 序列 预测 问题 ， 这 里 涉及 的 不 是 一 个 问 
题 而 是 两 个 问题 。 

口 如 何 寻找 以 递 推 公式 为 代表 的 “能 行 ” 的 “模式 ”? 

口 如 果 递 推 公式 (“能 行 ” 的 “模式 ” ) 不 唯一 该 如 何 取舍? 

其 实 第 二 个 问题 涉及 的 是 归纳 推理 能 否 保证 确定 性 的 哲学 问题 , 现在 让 我 们 先 来 


讨论 第 二 个 问题 。 
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其 实 ， 很 久 以 前 ， 莱 布 尼 欧 就 意识 到 了 这 个 问题 ， 他 提出 了 曲线 拟 合 停 论 :一 
张 纸 上 的 任何 有 限 个 点 总 是 能 找到 无 限 条 有 曲线 把 它们 串 起 来 。 这 意味 着 ， 给 定 任何 
有 限 的 观测 数据 , 总 有 无 限 的 归纳 推理 方式 , 总 有 无 限 的 规律 符合 有 限 的 观测 材料 ， 
同 果 未 必 同 因 ， 究 竟 哪 条 规律 才 是 决定 这 些 材料 的 真正 原因 呢 ? 为 什么 大 家 倾向 于 
接受 17 作为 问题 6) 的 答案 而 不 接受 17 + 8? 维特 根 斯 坦 遵守 规则 的 悖 论 与 此 紧密 相 
关 ， 任 何 规则 都 无 法 唯一 确定 行为 方式 ， 因 为 有 无 穷 多 的 行为 方式 可 以 和 这 条 规则 
相符 或 者 相 违 。 从 表面 上 看 ， 维 特 根 斯 坦 遵守 规则 悖 论 眼 莱 布 尼 芯 曲 线 拟 合 的 导论 
说 的 是 相反 的 两 件 事 : 维特 根 斯 坦 说 有 无 限 的 行为 方式 可 以 符合 或 违反 一 条 规则 ， 
莱 布 尼 获 说 可 以 有 无 限 多 的 规则 符合 给 定 的 有 限 多 的 行为 。 但 遵守 规则 的 悖 论 的 根 
源 事实 上 是 ， 主 体 不 能 通过 有 限 的 行为 方式 习 得 唯一 不 变 的 规则 概念 ， 所 以 规则 的 
语义 概念 不 明确 ， 规 则 本 身 只 能 通过 主体 在 社会 环境 中 各 种 “遵守 规则 的 行为 ”过 
程 中 获得 “ 隐 定 义 ”。 

哲学 家 古 德 曼 曾 给 出 过 一 个 绿 蓝 悖 论 的 例子 :目前 发 现 的 所 有 祖母 绿 都 是 绿 的 ， 
但 这 个 事实 本 身 与 以 下 两 个 假设 吻合 得 同样 好 。 


假设 一 : 所 有 祖母 绿 都 是 绿 的 。 
假设 二 : 所 有 祖母 绿 都 是 “ 绿 蓝 ”的 即 在 未 来 的 某 个 时 间 点 (比如 
2050 年 ) 前 所 有 的 祖母 绿 都 是 绿 的 ， 其 后 都 是 蓝 的 。 


因为 请 如 此 类 的 悖 论 ， 归 纳 推 理 的 有 效 性 一 直 饱 受 质 疑 ， 羔 布 尼 次 也 认为 有 限 
的 观测 无 法 确保 一 般 真 理 的 普遍 必然 性 ， 过 去 发 生 的 将 来 未 必 同 样 发生 。 哲 学 家 休 
席 认 为 ,归纳 仅仅 是 一 种 心理 习惯 ， 人 不 可 能 们 助 归纳 推理 确保 结论 的 确定 性 ， 从 
个 别 到 一 般 的 推理 不 具有 必然 性 。 归 纳 推理 需要 借助 于 “未 来 与 过 去 的 相似 性 ”， 
但 这 本 刁 顶 多 是 一 个 归纳 结论， 如 果 再 以 归纳 的 方式 辩护 它 的 有 效 性 ， 则 陷 人 隐 
辑 循环 。 


为 了 解决 这 个 问题 , 称 勒 试图 通过 引进 “日 然 的 齐 一 性 ”的 假设 作为 归纳 推理 的 
基础 。 但 “ 齐 一 性 ”的 精确 含义 完 苋 是 什么 ”在 羔 布 尼 次 那里 所 有 可 能 世界 部 必须 
符合 “充足 理由 律 ”， 虱 依照 “数学 规律 ”做 “机 械 ” 的 运转 。 在 无 穷 多 的 “机 械 ” 
的 “数学 规律 ”之 间 ， 羔 布 尼 次 动用 了 奥 卡 姆 闲 刀 一 一 强调 简单 性 的 标准 ， 认 为 规 
则 之 所 以 为 规则 束 必 须 价 单 ， 如 来 允许 任意 高 程度 的 复杂 性 ， 那 么 规则 也 束 不 能 称 
其 为 “规则 ”而 趋 近 “随机 ”了 ， 规 律 性 的 缺乏 或 者 说 复杂 性 的 过 融 将 导致 混沌 其 
至 “随机 ”。 
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在 真正 的 原因 不 明明 的 情况 下 ， 对 于 一 个 表述 简单 但 解释 力 、 预 测 力 强 的 假设 ， 
如 果 所 有 已 知 的 现象 都 跟 它 相符 合 ， 而 没有 现象 与 它 相 违背 ， 那 么 ， 在 实践 过 程 中 ， 
在 与 此 矛盾 的 现象 产生 之 前 ， 这 个 假设 就 可 以 暂时 拿 过 来 当 原 因 用 。 


茉 布 尼 次 的 这 种 观点 不 仅 适 用 于 日 常生 活 , 而且 与 当今 科学 方法 论 的 主流 观点 相 
息 合 。 科 学 哲学 家 波 普 尔 束 以 其 对 科学 方法 论 的 研究 而 著称 。 他 认为 ， 科 学 的 发 展 锭 
循 如 下 规律 : 


ef ee ek Sl pee 


针对 问题 Pi, 可 以 提出 许多 相互 苋 争 的 可 错 的 猜想 /假设 或 尝试 性 的 理论 7 然后 
逐一 考察 这 些 理论 ,根据 当前 的 观测 消除 错误 排除 掉 那 些 与 现象 不 相 容 的 猜想 。 对 于 
那些 能 够 解决 现存 问题 的 理论 排 一 个 序 ， 可 证 伪 性 越 高 的 理论 越 值得 重视 ， 然 后 再 用 
它们 进一步 尝试 解决 产生 的 新 问题 P。 随 着 问题 的 不 断 深入 , 越 可 证 伪 但 能 够 经 受 得 
住 严格 的 反复 检验 的 理论 越 交 近 真 理 , 科学 就 这 样 通过 试 错 法 不 断 前 行 。 这 种 不 断 提 
出 猜想 反复 试 错 的 过 程 类 似 于 生物 的 基因 变异 与 日 然 选择 的 进化 过 程 : 适合 生物 生存 
的 变异 基因 得 以 保存 ， 不 适合 的 被 淘汰 ; 适合 解决 问题 的 理论 得 以 留存 ， 不 适合 的 被 
排除 。 作 为 “全 称 ” 命 题 的 真理 不 能 被 有 限 的 事例 证 明 , 但 可 以 被 证 伪 ， 所 以 在 此 过 
程 中 重要 的 是 对 问题 求解 的 适应 性 ， 而 不 是 寻求 一 筋 永 逸 的 证 明 。 但 可 证 伪 性 是 一 个 
纯粹 主观 的 概念 ,往往 认为 越 简单 的 理论 越 可 证 伪 ， 也 就 是 说 ， 各 种 理论 猜想 是 按照 
简单 性 排序 的 : TI < <.…， 但 简单 性 同样 缺乏 一 个 客观 的 衡量 标准 。 几 5-1 展示 了 
科学 方法 论 的 过 程 。 


不 可 和 否认, 在 现实 生活 中 ,经验 养 成 的 心理 习惯 使 人 获 益 的 时 候 多 ,， 受 损 的 时 候 
少 , 这 是 目 然 选 择 的 结 朱 。 虽 然 简 单 性 缺乏 一 个 客观 的 标准 ，“ 归 纳 仅仅 是 一 个 心理 
习惯 ”， 但 对 简单 性 的 心理 偏好 得 到 了 一 些 格式 塔 心理 学 实验 的 文 持 。 格 式 塔 心 理学 
家 们 通过 一 系列 实验 总 结 出 ， 人 在 知 党 时 倾 问 于 按照 一 定 的 模式 把 感 党 材 料 组 织 为 一 
个 有 机 的 整体 ， 而 不 是 知 党 为 一 堆 个 别 的 感觉 材料 的 简单 集合 。 人 在 将 感 党 材料 组 织 
为 整体 的 过 程 中 ， 一 般 避 循 接 近 法 则 、 连 续 法 则 、 闭 合法 则 、 经 验 法 则 、 相 似 法 则 、 
对 称 法 则 等 ， 而 这 些 都 可 以 看 作 完 形 趋同 法 则 的 不 同 表 现形 式 ， 也 就 是 人 的 认 知 有 趋 
回 于 简单 有 序 、 闭 合 完整 的 倾 问 。 比 如 和 在 看 到 图 5-2 所 示 的 第 一 张 图 片 时 倾 问 于 目 
动脑 补 出 第 四 张 图 片 。 所 以 从 认 知 上 看 ， 简 单 性 体现 在 知觉 空间 的 邻近 性 、 连 续 性 、 
完整 性 ， 事 物 规 则 的 相似 性 、 对 称 性 〈 比如 馈 像 、 平 移 、 旋 转 、 伸 见 等 变换 下 的 不 变 
性 等 ) 以 及 与 以 往 经 验 的 吻合 性 等 特征 上 。 
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观测 现象 / 2 


验证 猜想 /理论 /假设 


提出 猜想 /理论 /假设 


mg 


“ee 


图 5-1 科学 方法 论 


ni 


图 5-2 被 正方 形 片 盖 住 的 那 部 分 最 有 可 能 是 什么 样子 的 ? 看 到 第 一 张 图 的 时 候 你 
最 期 待 的 是 否 是 第 四 张 图 呢 ? 


连续 、 财 合 、 相 似 、 对 称 等 仅仅 是 一 些 最 基本 的 直观 性 质 ， 具 有 这 些 属性 的 模式 
更 易于 被 大 脑 记忆 存储 ,但 这 些 远 没有 穷尽 简单 性 的 所 有 内 独 。 如 何 才 算 穷 尽 傈 单 性 
的 内 溯 ? 这 就 不 能 只 考虑 直观 易 见 的 基本 模式 ， 而 要 考虑 所 有 可 能 的 模式 。 

也 就 是 说 ， 对 于 “归纳 推理 能 否 保 证 确定 性 ”的 上 暂 学 问题 的 回答 依赖 于 一 个 模糊 
的 概念 一 一 简单 性 。 即使 有 不 止 一 个 递 推 公式 符合 给 定 的 数列 , 但 越 简单 的 那个 越 好 。 
而 要 精确 定义 “简单 性 ”， 就 要 考虑 所 有 可 能 的 “模式 ”。 


压缩 vs 预测 、 编 码 vs 概 率 


在 界定 所 有 可 能 的 “模式 ”之 前 ， 请 先 阅读 下 面 这 则 小 故事 ， 体 会 一 下 我 们 主观 
理解 的 “简单 性 ”。 
手 扶 扬 杖 的 外 星 绅 士 造 访 地 球 , 想 把 地 球 文明 传播 到 自己 星球 ,临别 时 ， 


地 球 人 慷慨 赠送 给 他 一 套 百 科 全 书 : “全 部 人 类 文明 尽 在 其 中 ! ”绅士 谢绝 : 
人 
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历史 修 久 的 地 球 文明 直观 上 非常 “不 简单 ”, 需要 很 多 厚 厚 的 百科 全 书 才能 记载 ， 
外 星 绅士 手杖 上 的 一 点 却 让 人 觉得 再 “简单 ”不 过 , 但 二 者 却 是 等 价 的 , 仅仅 通过 “一 
点 ”， 外 星 绅士 就 能 把 整个 地 球 文明 无 损 地 市 走 。 这 是 怎么 回 事 呢 ? 答案 是 编码 。 通 
过 编 但 进行 数据 压缩 。 


那么 现在 我 们 来 考虑 一 个 数据 压缩 的 问题 ， 比 如 ， 如 何 用 数字 串 0, 1 对 英文 版 的 
《战争 与 和 平 》 进 行 编码 ， 要 求 翻 译 成 数字 串 后 还 可 以 译 回 原来 的 英文 ， 而 且 要 让 一 
译 后 的 数字 串 尽量 短 。 


让 我 们 暂时 先 抛 开 唯一 可 详 的 问题 痛 先 考虑 : 让 一 篇 英文 文章 编码 尽 可 能 短 的 
最 直观 最 直接 可 用 的 信息 是 什么 ?英文 字母 出 现 的 频率 不 同 ! 如 图 5-3 所 示 ， 有 些 英 
文子 母 (如 e、t、a) 出 现 的 频 座 会 远 远 高 于 其 他 子 母 (如 j、q、z ) 。 如 采 想 让 编码 
后 的 文章 更 短 ， 就 需要 采用 采种 变 长 他， 对 频 烤 出 现 的 字母 分 配 较 短 的 措 述 ， 而 对 不 
经 芝 出现 的 字母 分 配 较 长 的 摘 述 。 这 就 是 这 里 我 们 要 用 到 的 下 观 概念 。 


事实 上 ， 如 末 已 知客 观 概率 分 布 P， 可 以 证 明 ， 编 码 的 期 望 码 长 必 大 于 等 于 菏 个 
下 界 ， 这 个 下 界 束 是 香农 入 。 采 用 某 些 好 的 编码 方式 可 以 潮 近 地 接近 其 至 在 某 些 理想 
情况 下 达到 这 个 下 界 。 如 打包 略 码 长 必须 是 茶 个 整数 这 个 限制 ， 那么 ,对 于 x 采用 长 
度 为 -log; Po 的 方式 编码 ， 就 可 以 达到 这 个 下 界 , 用 这 个 长 度 或 接近 这 个 长 度 进 行 编 
码 是 可 行 的 ， 比 如 稚 夫 曼 人 码 就 可 以 以 类 似 的 码 长 实现 期 望 码 长 最 小 的 日 标 ,， 它 就 是 对 
局 概率 事件 赋予 短 的 编码 ， 对 低 概 从事 件 赋 也 长 的 编码 。 


0.14 


0.12 


0.1 


0.08 


0.06 


0.04 


0.02 


abcdefghijklmnopqrstuvwxyz 


5-3 ”英文 字母 使 用 频率 
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不 管 上 帝 以 何 种 概率 分 布 创 世 ， 假 如 他 对 可 能 的 历史 的 编码 方式 是 最 优 的 ,那么 
奥 卡 姆 剃刀 就 有 意义 。 假 如 客观 的 概率 分 布 未 知 ， 而 已 知 历史 经 验 *， 如 果 对 x 有 一 
些 编码 方式 code(x), 然后 把 霍 夫 曼 编码 的 思想 反 过 来 ， 对 于 短 的 编码 应 该 赋予 高 的 概 
率 /信念 ， 对 于 长 的 编码 应 该 赋予 低 的 概率 /信念 ， 这 样 就 可 以 诱导 出 某 种 慨 率 /信念 


P(x) .一 ot) 


其 中 /Co 表示 yx 的 长 度 。 

根据 奥 卡 姆 剃刀 ,简单 的 猜想 code(Co) 更 似 真 ，code(Co) 越 短 ， 它 的 真理 性 越 高 。 那 
么 ， 这 种 诱导 出 的 概率 反映 的 是 对 产生 x* 的 真实 分 布 的 猜测 ， 理 想 的 编码 可 以 诱导 出 
最 似 真 的 “信念 ”， 即 更 接近 上 帝 创 世 采 用 的 “客观 概率 ”。 但 什么 是 理想 的 编码 方 
式 呢 ? 


青 定 “ 模 却 可 计算 的 “路 径 


上 各 一 计算 ， 世 界 就 创造 出 来 了 。 
一 一 散布 尼 英 


通过 上 交 的 讨论 我 们 发 现 ,复杂 的 事物 要 想 侧 单 地 表达 必须 先 压 盎 。 压 缩 可 以 通 
过 编码 来 实现 ， 而 编码 与 概率 有 着 奇妙 的 联系 。 虽 然 我 们 现在 还 不 知道 这 种 概率 完 葛 
有 多 大 用 ,能 否 带 助 我 们 最 终 解 决 序列 预测 的 问题 ,但 我 们 狂 测 ， 通 过 理想 的 编码 放 
吐出 的 概率 在 某 种 意义 上 反映 了 序列 (或 现象 ) 的 真实 分 布 ， 所 以 我 们 首先 应 该 讨论 
清楚 什么 是 理想 的 编码 。 


给 定 英 文 版 的 《 臧 争 与 和 平 》， 只 针对 这 本 小 说 来 说 ， 和 直观 上 理想 的 编码 方式 说 
的 应 该 是 ， 把 它 翻 详 成 0, 1 序列 后 的 书 厚度 最 注 ， 但 要 做 到 这 一 点 ， 仪 仪 通过 考虑 前 
面 捉 到 的 字母 的 出 现 频率 进 行 编码 就 能 实现 吗 ? 答案 是 否定 的 。 因 为 ,语言 不 是 挪 色 
了 产生 的 ,不 是 满足 多 项 分 布 的 们 努 利 试验 。 如 采 考 感 词 的 层面 ， 我 们 会 发 现 ， 喘 文 
中 经 常会 有 某 些 固定 搭配 , 某 些 词 的 后 面 跟随 为 一 些 词 的 频率 非 闸 高 ， 比 如 deal 后 面 
紧 跟 with 的 可 能 性 很 大 。 上 升 到 句子 的 层面 也 会 有 类 似 的 规律 ,比如 菏 些 连词 的 固定 
搭配 , 在 过 引 导 的 从 名 后 ,下 一 个 从 名 极 有 可 能 是 由 then 引导 的 。 任何 类 似 的 规律 或 
模式 都 可 以 为 我 所 用 ,不 管 是 字母 层面 、 词 说 层 面 还 是 句子 、 篇 草 层 面 ， 都 可 以 帮助 
压缩 编码 后 的 书 的 厚度 。 所 以 分 析 简 单 性 必须 考虑 所 有 可 能 的 醒 式 ， 不 管 它们 隐藏 得 
有 多 深 。 
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从 讨论 序列 预测 涉及 的 第 二 个 问题 〈 归纳 能 人 否 你 证 确定 性 ) 开始 ,我们 一 路 退 究 
到 了 人 徐 单 性 的 概念 ,追究 到 了 压缩 与 编码 的 问题 ， 而 这 竞 把 我 们 引 到 了 序列 预测 涉及 
的 第 一 个 问题 的 核心 概念 上 : 以 递 推 公式 为 代表 的 规律 或 模式 究竟 是 什么 ”这 种 所 谓 
的 规律 或 模式 到 帮 有 多 少 ? 


在 回答 这 个 问题 之 前 , 不妨 让 我 们 先 回顾 一 下 前 面 的 智商 测试 题 。 很 容易 看 出 来 
前 几 道 题 的 规律 ， 无 非 是 某 种 递 推 公式 而 已 。 比 如 ， 下 面 的 第 一 个 数字 串 ， 我 们 都 知 
道 它 是 圆周 率 的 小 数位 , 可 你 能 看 出 第 二 个 数字 串 的 规律 吗 ? 佑 计 很 少 有 人 能 直接 看 
出 来 ， 如 有 条 你 看 了 半天 仍然 看 不 出 来 , 那么 估计 你 会 形 气 地 感觉 这 个 数字 串 跟 随便 抛 
便 币 抛 出 来 的 数字 串 没 什么 区 别 。 但 其 实 它 也 是 圆周 率 的 小 数位 ， 只 是 使 用 二 进 制 表 
示 而 已 。 现 在 你 知道 答案 了 ， 然 后 动手 验证 了 一 下 ， 发 现 没 错 ， 然 后 你 会 同意 ， 这 个 
数字 串 也 是 有 规律 的 ， 只 是 它 的 规律 隐藏 得 更 浆 而 已 。 但 为 什么 隐藏 得 这 么 深 的 规律 
仍然 可 以 被 称 作 规律 ” 我 们 会 说 ， 因 为 加 周 认 可 以 通过 菏 种 能 行 的 递 推 公式 运算 得 
到 ， 十 进 制 数 到 二 进 制 数 的 转换 也 是 一 种 能 行 的 运算 ， 然 后 通过 二 者 的 复合 运算 即 可 
得 到 我 们 想 要 的 数字 串 。 


141592653 
00100100001111110110101010001000 
因此 , 这 里 我 们 一 直 把 规律 或 模式 看 作 某 种 能 行 的 计算 , 正 是 为 了 刻画 这 种 能 行 
的 计算 模式 ， 图 灵 发 明了 图 灵机 (如 图 5-4 所 示 ) 。 


5-4 ”图 灵机 


图 灵机 是 个 超级 简单 的 计算 厂 置 (参见 本 书 第 2 章 ) ,但 它 的 计算 能 力 却 


异常 强 
大 ， 可 以 证 明 ， 图 灵机 可 计算 的 函数 类 对 应 了 部 分 递归 函数 类 ， 而 当今 最 前 沿 最 局 次 
的 理论 物理 学 所 用 到 的 函数 部 不 会 超出 这 个 类 。 
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鉴于 图 灵机 强大 的 威力 ,图 灵 提 出 了 图 灵 论 题 : 任何 能 行 可 计算 的 困 数 都 是 图 灵 
机 可 计算 的 。 这 一 论题 至 今 没 有 被 推翻 。 人 们 从 各 种 角度 做 出 了 各 种 刻画 能 行 可 计算 
的 答 试 ， 试 图 超越 图 灵机 可 计算 的 概念 ， 但 最 后 发 现 这 些 模型 都 是 彼此 等 价 的 。 图 灵 
论题 及 各 种 等 价 的 计算 模型 如 下 所 示 : 


能 行 可 计算 
| 
递归 = 图 灵 可 计算 
| 
FT TT 1 Tt 
和 人 劳 可 正义 三 DerDrand-rTodelH 让 异 


| 
任何 一 个 协调 的 包含 R 的 形式 系统 可 表示 
| 
和 -可 定义 = 流程 图 〈 或 "while 程序 ) 可 计算 
| 


附加 一 条 无 穷 带 的 神经 元 网 络 可 计算 -“ 生 命 游戏 " 


| 
Post/Markov/McCarthy/Kolmogorov 及 Uspensky 可 计算 ... 


如 果 人 的 意识 是 可 计算 的 ,这 种 简单 的 图 灵机 也 将 可 以 涌现 出 意识 现象 ; 如果 现 
实 世 界 本 身 都 是 可 计算 的 , 那么 现实 世界 的 终极 真理 将 不 过 是 某 个 写 在 这 种 图 灵机 上 
的 程序 ( 如 表 5-1 所 示 ) 。 


表 5-1 ”科学 是 对 经 验 的 理解 ， 理 解 就 是 压缩 ， 预 测 可 以 看 作 茶 种 解压 缩 


公理 形式 系统 定 理 
程序 通用 图 灵机 输出 
编码 解码 原始 数据 
科学 理论 推演 经 验 现象 
DNA 演化 有 机 体 
终极 理念 上 帝 宇宙 


“可 计算 ”的 概念 相当 稳定 ， 上 面 提 到 的 理论 R 是 一 个 非常 弱 的 形式 系统 ， 比 鲁 
演 逊 算术 还 蚤 , 而 重演 逊 算术 又 远 弱 于 我 们 稼 见 的 度 亚 族 算 术 , 但 任何 比 它 强 的 系统 ， 
不 管 有 多 强 ， 最 后 “可 表示 ”的 冰 数 都 是 一 样 的 ， 都 是 递归 困 数 ， 也 只 有 递归 上 困 数 形 
式 系统 “可 表示 ”。 从 上 面 列 出 的 各 种 等 价 的 定义 可 以 看 出 ， 到 目前 为 止 ， 从 各 种 不 
同 角 度 对 “能 行 可 计算 ”概念 的 把 握 都 聚焦 了 同一 个 东西 。 这 些 神 极 大 地 强化 了 我 们 
对 图 灵 论 题 的 信念 ， 甚 至 远 远 大 于 对 任何 主流 的 物理 学 理论 的 信任 程度 。 人 脑 和 世界 
可 计算 的 猜想 越 来 越 受 重视 ， 很 大 程度 上 正 是 源 于 图 灵 论 题 牢 不 可 破 的 信念 。 
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如 果 不 限 制 计 算 资 源 的 话 ， 人 脑 完 全 可 以 支持 通用 计算 ， 也 就 是 说 ， 可 以 模拟 
任何 可 能 的 计算 。 如 果 现 实 世 界 确实 是 可 计算 的 ,那么 ， 在 忽略 计算 资源 限制 的 情 
况 下 ， 人 脑 原则 上 可 以 模拟 现实 世界 (包含 人 脑 自 身 ) 的 运行 。 人 脑 甚 至 可 以 枚 举 
所 有 可 能 的 计算 (所 有 可 能 世界 ) 。 所 有 可 能 尽 在 掌握 ， 是 我 们 尽情 删 减 、 挑 选 的 
时 候 了 。 


量化 简单 性 一 一 算法 复杂 性 


上 沉 走 捷径 。 
让 一 切 尽 量 简单 ， 但 不 更 简单 。 
一 一 阿尔 伯 特 .发 因 斯 坦 


我 们 把 规律 或 模式 看 作 可 计算 的 函数 , 贯 罕有 和 穷 个 点 的 路 从 有 (不 可 效 ) 无穷 多 ， 
我 们 只 关注 那些 可 计算 的 路 径 , 但 这 种 可 计算 的 函数 仍 有 可 数 无 穷 多 ， 哪 条 才 是 我 们 
想 要 的 呢 ?” 如 果 我 们 不 知道 哪 条 是 我 们 想 要 的 ,又 怎么 信 计 下 一 个 点 会 落 在 哪里 呢 ? 
虽然 我 们 把 穿 过 有 限 个 点 的 路 径 从 不 可 数 无 穷 多 条 减少 到 了 可 数 无 穷 多 条 , 但 莱 布 尼 
次 的 曲线 拟 合 怪 论 ( 见 图 5-5 ) 依然 困扰 着 我 们 。 


图 5-5 ” 莱 布 尼 菊 曲线 拟 合 悖 论 


我 们 无 法 选 出 唯一 的 一 条 一 往 无 前 地 走 下 去 ,这 就 是 一 下 挑战 着 哲学 家 们 的 “ 同 
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果 未 必 同 因 ” 的 归纳 问题 。 羔 布 尼 次 给 出 的 解决 方案 是 借助 于 简单 性 ， 虽然 我 们 无 法 
选 出 唯一 的 一 条 , 但 我 们 可 以 有 所 偏好 ， 越 简单 的 路 径 我 们 可 以 赋予 越 多 的 心理 预期 
(心理 习惯 ) ， 然 后 根据 观测 到 的 新 点 不 断 调整 这 种 心理 预期 。 至 于 如 何 调整 后 面 再 
讨论 ,首先 面 对 的 问题 是 ， 简 单 性 有 客观 的 衡量 标准 吗 ? 柯 尔 莫 哥 洛 夫 通过 定义 算法 
复杂 性 正面 回答 了 这 个 问题 。 

前 面 我 们 谈 到 了 把 规律 或 模式 等 同 于 图 灵 可 计算 的 吨 数 , 在 图 灵机 上 真正 计算 这 
个 函数 的 程序 就 有 一 个 长 度 ， 用 这 个 程序 的 长 度 衡 量 简 单 性 就 是 一 个 很 直观 的 想法 。 
但 我 们 不 禁 要 问 ， 即 使 是 通用 图 灵机 也 有 无 穷 多 种 ,虽然 计算 的 是 同一 个 子 数 ,但 会 
不 会 在 一 个 通用 图 灵机 上 的 程序 很 短 ,在 男 一 个 通用 图 灵机 上 的 程序 可 能 需要 很 长 ? 
不 必 担 心 , 我 们 可 以 证 明 某 种 不 变性 ! 定义 序列 x 的 算法 复杂 性 为 某 通 用 图 灵机 U 上 
输出 它 的 最 短程 序 的 长 度 。 

相对 于 任何 其 他 通用 图 灵机 U',， 在 某 个 (依赖 于 U' 但 不 依赖 于 x 的 ) 常数 界 内 ， 
通用 图 灵机 U' 上 计算 x 的 最 短程 序 的 长 度 近 似 等 于 x 的 算法 复杂 性 。 因 为 通用 图 灵机 
可 以 模拟 任何 图 灵机 (包括 各 种 通用 网 灵机 ) ， 比 如 和 常见 的 程序 语言 C 或 Java 等 都 可 
以 看 作 通 用 网 灵机 。 你 可 以 在 Java 霹 言 中 写 一 个 翻译 程序 , 将 任何 C 语 言 的 程序 自动 
翻译 成 Java 语言 的 程序 , 假如 p 是 C 语 言 中 计算 x 的 最 短程 序 ,p' 是 借助 翻译 程序 把 
p 从 CC 语言 翻译 到 Java 语 言 的 对 应 程序 ， 所 以 p' 在 Java 中 计算 x， 而且 p' 不 会 比 p 
长 多 少 , 最 多 相差 一 个 翻译 程序 的 长 度 而 已 ,反之 , 从 Java 到 C 也 可 以 有 类 似 的 翻译 。 


因此 , 在 与 输入 无 关 的 津 数 界 内 不 依赖 于 具体 哪个 通用 图 灵机 的 意义 上 , 算法 复 
杂 性 概念 客观 地 刻画 了 催 单 性 概念 。 

现在 有 T 了 位 单 性 概念 ， 我 们 怒 不 住 要 定义 心理 预期 ， 进 而 解决 归纳 问题 了 。 如 
何 定义 心理 预期 呢 ? 分 配 心理 预期 无 非 就 是 分 配 菏 种 权重 ， 而 这 种 权重 需要 与 和 催 单 
性 或 算法 复 霖 性 成 员 相 关 的 关系 ， 越 简单 越 俩 好 。 最 目 然 的 想法 就 是 ， 定 义 穿 过 序 
列 x 的 一 条 路 径 〈 可 计算 的 函数 访 的 权重 ， 可 以 借助 通用 图 灵机 上 计算 函数 工 的 程 
序 p。 回 顾 前 面 我 们 用 编码 诱导 概率 的 方式 ,我 们 把 p 看 作 x 的 编码 ， 对 于 短 的 编码 
赋予 蜗 的 概率 ,对 于 长 的 编码 赋予 小 的 概率 ， 编 码 长 度 与 心理 预期 负 相 关 。 这 样 ， 
对 于 任何 对 x 的 编码 方式 p， 即 p 与 x 一 任 ， 或 者 说 p 输 出 x， 那 么 我 们 对 pp 赋予 的 
偏好 /信念 大 小 就 是 2 2。 在 没有 任何 经 验 的 情况 下 ， 我 们 的 总 信念 就 是 所 有 停机 程 
序 的 信念 之 和 ， 但 很 不 笠 ， 它 是 发 散 的 ! 这 意味 看 我 们 赋予 信念 的 方式 无 法 归 一 化 
为 合适 的 概率 测度 ,我 们 从 算法 诱导 概 认 /和 完 验 信念 的 方式 是 有 问题 的 ， 所 以 不 能 
虑 所 有 可 能 的 停机 程序 。 
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为 了 解决 这 个 问题 ,我 们 不 得 不 放弃 一 般 的 图 灵机 ， 转 而 考虑 某 种 特殊 类 型 的 图 
灵机 一 一 前 级 图 录 机 ( 如 图 5-6 所 示 ) 。 这 种 图 灵机 有 三 条 带子 ,一 条 单 站 的 输入 惠 ， 
条 单 回 的 输出 带 , 一 条 双 回 的 工作 这 ,输入 带 只 读 , 输出 带 只 写 , 单 癌 带 上 的 读 头 、 
写 头 都 只 能 从 左 往 右 移动 。 这 种 前 绥 图 灵机 上 所 有 停机 的 程序 构成 前 缀 人 码 : 没有 一 个 
程序 是 妃 一 个 程序 的 前 缀 。 这 是 一 种 “ 目 定 界 ”的 程序 一 一 只 该 头 该 完 输 入 市 上 的 程 
序 就 知道 这 个 程序 结束 了， 而 不 必 担 心 有 男 一 个 更 长 的 程序 是 它 的 延伸 。 事实 上 , 在 
计算 同样 的 函数 的 意义 上 , 任何 普通 的 图 灵机 程序 都 可 以 等 价 地 改写 为 这 种 “ 目 定 界 ” 
的 程序 。 因 此 可 以 说 , 虽然 我 们 限制 图 录 机 的 类 型 ,但 事实 上 我 们 并 没有 真 的 丢失 
任何 假设 。 

单调 图 灵机 与 前 绥 图 灵机 的 便 件 完全 一 样 ， 唯 一 的 区 别 是 ， 对 于 前 绥 图 灵机 ， 我 
们 只 考虑 那些 停机 的 程序 ， 所 有 人 机 的 程序 构成 前 绥 码 。 而 单调 图 灵机 不 必 停 机 ， 可 
以 无 限 运 行 下 去 。 但 对 于 任何 给 定 的 输出 x, 输 出 x 的 所 有 单调 图 灵机 程序 构成 前 级 码 。 


5-6 ”前 缀 /单调 图 灵机 


针对 这 类 前 级 /单调 图 灵机 ， 可 以 构建 通用 前 级 /单调 图 灵机 ， 然 后 可 以 定义 字符 
串 x 的 算法 复杂 性 K(x) 为 通用 单调 图 灵机 输出 x 的 最 短程 序 的 长 度 ”"， 如 图 5-7 所 示 。 


QD 有 意思 的 是 ， 可 以 证 明 ， 对 于 任何 可 计算 的 概率 分 布 , 算法 复杂 性 的 期 望 近似 等 于 香农 炉 。 
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图 5-7 算法 复杂 性 


依照 前 面 的 方式 , 现在 可 以 定义 对 前 缀 图 灵机 程序 p 的 权重 (信念 /偏好 ) 为 2°， 
而 且 可 以 证 明 ， 所 有 停机 的 前 缀 图 灵机 程序 的 信念 之 和 是 收敛 的 "， 所 以 可 以 归 一 化 
为 合适 的 概率 测度 。 

哲学 家 伊 壁 鸠 鲁 认为 ,不 仅 要 考 愿 与 经 验 一 致 的 最 简单 的 假设， 所 有 不 违背 经 验 
的 假设 都 要 保留 。 

那么 ， 下 面 考虑 一 个 问题 : 如 图 5-8 所 示 ， 如 末 在 单调 通用 图 灵机 的 输入 市 上 随 
机 地 抛掷 一 枚 质地 均 色 的 硬币 ， 抛 出 正面 写 1， 抛 出 反面 写 0， 那 么 输出 市 上 会 输出 
序列 x 的 概率 为 多 大 ? 


图 5-8 ”上帝 抛 硬币 ! 抛 到 图 灵机 上 ! 


J 这 就 是 著名 的 Chaitin 常数 , 它 是 算法 随机 的 , 借助 它 可 以 证 明 茶 种 版 本 的 不 完全 性 定理 : 任何 包含 
初等 算术 的 可 递归 公理 化 的 协调 的 形式 系统 都 只 能 判定 的 有 限 位 数字 。 
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不 难 发 现 ， 答 案 为 : 


WO > 
PiU(P)=x* 
这 恕 是 条 洛 更 谢 天 定义 的 算法 概率 。 其 中 ，UC) = 表示 pp 输出 x 后 未 必 售 机， 
可 以 继续 输出 下 去 。 这 也 是 奥 卡 姆 与 伊 壁 鸠 鲁 的 打 中 ， 伊 壁 鸠 鲁 要 求 保 留 所 有 与 经 验 
- 致 的 假设 , 奥 卡 姆 独 钟 最 简单 的 假设 , 而 算法 概率 既 你 留 了 所 肚 经 验 一 致 的 假设 ， 
又 对 简单 的 假设 赋予 了 更 高 的 仿 好 ， 同 时 兼顾 了 二 者 。 


设想 一 下 ， 如 有 果 这 枚 质地 均匀 的 便 币 不 是 抛 在 图 灵机 的 输入 市 上 ， 而 是 直接 抛 出 
什么 就 作为 结果 输出 什么 ， 那 么 历史 序列 x 的 概率 将 是 2 中， 下 一 刻 历 史 序 列 x 的 延 
伸 是 0 还 是 1 的 条 件 概 率 将 是 /2。 也 就 是 说 ， 如 果 我 们 的 世界 是 以 一 种 完全 随机 的 
方式 创 世 的 ， 那么 我 们 还 有 任何 办 法 进行 某 种 可 徘 的 预测 吗 ? 

我 们 允许 上 征 据 色 子 ,但 必须 撕 在 图 录 机 上 ! 上 和 如 此 至 真 至 善 ， 表 面 上 看 似 无 
私 (随机 ) ， 事 实 上 以 更 高 的 可 能 性 输送 更 催 单 的 模式 供 我 们 归纳 学 习 。 换 名 话说 ， 
奥 卡 姆 剃刀 是 种 信念 ， 是 对 简单 性 的 信念 ， 是 对 上 帝 编 码 的 最 优 性 的 信念 。 

通用 智能 的 核心 一 一 通用 归纳 的 讲解 到 此 结束 ， 接 下 来 ,我 们 只 需要 在 此 基础 上 
添加 一 个 序 贯 决策 过 程 即 可 创造 出 通用 智能 主体 AIXI 了 。 


主体 与 环境 的 交互 一 一 通用 智能 


智能 是 主体 在 各 种 各 样 的 纷繁 复杂 的 环境 中 实现 目标 的 能 力 。 
一 一 肖 恩 . 莱 格 ， 马 库 斯 ， 胡 特 


前 面 讨论 的 通用 归纳 模型 事实 上 是 一 种 预测 模型 ， 而且 ,预测 的 行为 本 号 并 不 构 
成 对 环境 的 任何 影响 , 虽然 主体 对 环境 作出 了 预测 , 但 不 会 采取 任何 行为 去 改变 环境 。 
但 现实 生活 中 ,我 们 部 是 世界 的 一 份子 ,我们 的 每 一 个 行为 都 在 有 意 无 意 地 影响 着 环 
境 ， 而 且 ， 很 多 时 候 ， 重 要 的 不 是 解释 世界 ， 而 是 改造 世界 。 比 如 ， 我 们 人 研究 股市 的 
模式 ,根据 目 己 发 现 的 模式 预测 股市 随后 的 走势 ,然后 根据 预测 结果 决定 美 进 还 是 买 
出 ， 但 无 论 是 灭 进 还 是 卖 出 ， 我 们 的 交易 行为 痢 反 过 来 影 啊 春 股市 的 波动 。 这 个 过 程 
可 以 看 作 主 体 与 环境 的 交互 过 程 。 


考虑 一 个 面 对 未 知 环境 的 主体 ， 它 与 环境 不 断交 互 ( 如 图 5-9 所 示 ) 。 在 每 一 个 
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回合 中 ， 主 体 都 对 环境 作出 某 种 动作 ， 然 后 这 个 动作 激发 环境 作出 某 种 反应 ， 反 过 来 
给 主体 一 些 反馈 。 主体 感知 到 这 种 反馈 , 同时 从 中 体会 到 某 种 正面 (和 兰 福 ) 或 负面 ( 莫 
伤 ) 的 效用 ,然后 计划 下 一 回合 的 交互 该 采取 哪 种 动作 ， 主 体 的 所 有 信息 部 来 自 过 去 
与 环境 交互 的 历史 ， 它 对 未 知 环境 的 评估 也 主要 依赖 于 这 些 信息 。 

如 果 主 体 和 环境 都 是 确定 性 的 ， 那 么 二 者 的 交互 可 以 看 作 两 个 程序 (p 和 9 ) 的 
交互 ， 其 中 一 个 的 输出 是 为 一 个 的 输入 ,一 个 的 输入 是 妨 一 个 的 输出 。 

如 图 5-10 所 示 , p 的 输入 市 是 4 的 输出 市 , p 的 输出 市 是 4 的 输入 带 。 在 第 K 个 回 
合 , 主体 bp 输出 (做 动作 ) ar, 环境 gq 读 取 at， 然后 输出 ot。 伴 随 着 o1 还 反馈 给 主体 p 
菏 种 效用 nn， 主体 p 读 取 (感知 到 ) ol 和 nw， 然 后 进行 下 一 个 (第 k+1 个 ) 回合 。 


如 有 果 我 做 工作 a， 
世界 将 成 为 哪 种 状态 ? 


在 那 种 状态 里 ， 
我 的 芋 福 指数 如 何 ? 


5-9 主体 与 环境 的 交互 


图 5-10 主体 与 环境 的 交互 


生活 是 一 系列 选择 的 总 和 ， 如 果 你 选择 了 做 at， 你 就 可 能 面 对 okt、 品尝 ms 要 想 
收获 更 多 ， 就 需要 慎重 选择 ， 立 足 当 下 ， 评 估 未 来 。 可 如 何 立足 当下 ， 评 估 未 来 呢 ? 
前 面 处 理 归纳 问题 时 ， 我 们 用 算法 概率 来 估 测 可 能 的 未 来 历史 ， 这 里 也 一 样 , 我 们 评 
估 主 体 与 所 有 可 能 的 环境 g 交 互 出 的 所 有 可 能 的 历史 ,对 于 简单 的 环境 赋予 高 的 偏好 ， 
对 于 复杂 的 环境 赋予 低 的 偏好 ， 然 后 用 综合 权衡 后 的 算法 概率 来 评估 可 能 的 历史 
qo .…4,0,1，( 假设 主体 的 生命 长 度 为 m) 。 


最 智能 的 主体 就 是 在 这 种 不 确定 的 环境 中 最 大 化 未 来 的 期 望 昧 积 效用 的 主体 
AIXI( 见 图 5-11 ) 。 也 就 是 说 ,在 主体 与 环境 交互 过 程 中 ,主体 最 优 的 行为 方式 就 是 
依照 算法 概率 (主观 信念 ) 评 佑 未 知 环境 、 寻 求 期 望 累积 效用 最 大 化 。 在 主体 与 环境 
交互 的 第 Kk 个 回合 ， 主 体 最 优 的 行为 方式 是 : 


qi :=argmax >_...max >》 [7 +...+7,] > 2 (AIXI ) 


OK 


人 qi:U (gq,a1..Qm )=017 .0m rn 


1 
90°0 504 


1001 


图 5-11 AIXI 与 环境 的 较量 


我 们 只 用 这 一 个 公式 就 定义 了 通用 智能 主体 。 注 意 ， 这 里 的 期 望 4 》 ) 和 最 大 化 
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(max ) 要 按 顺 序 交 错 进 行 ( 如 图 5-12 所 示 ) 。 


5-12 M-E-M-E 


即使 对 于 不 确定 的 环境 ， 只 要 它 是 有 规律 的 ( 看 作 某 种 可 计算 的 测度 ) ， 那 么 ， 
跟 通 用 归纳 时 的 情形 一 样 ， 我 们 的 算法 概率 仍然 可 以 很 好 地 荧 近 真实 的 环境 ， 上 面 定 
义 的 智能 主体 AIXI 仍然 可 以 很 好 地 适应 。 而 且 可 以 证 明 , AIXI 是 平衡 由 昧 托 最 优 的 ， 
即使 有 主体 在 某 些 环境 下 能 获得 比 AIXI 更 多 的 回报 ， 但 在 另外 一 些 环境 下 必 将 付出 
更 惨重 的 代价 。 


对 于 AIXI 的 各 种 优良 性 质 ， 可 以 参看 胡 特 的 文章 '。 


决策 论 


十 


通用 归纳 
| 
通用 人 工 智能 模型 一 一 


5-13 胡 特 的 通用 智能 模型 AlXl 可 以 看 作 最 大 化 期 望 累积 效用 的 序 贯 决策 过 程 
与 索 洛 莫 诺 夫 序列 预测 的 通用 归纳 模型 的 结合 ， 是 一 种 以 算法 概率 寻求 期 
望 累 积 效 用 最 大 化 的 决策 


AlIXI 能 处 理 什 么 问题 ? 


AIXI 究 竟 能 处 理 什 么 具体 问题 呢 ? 事实 上 ， 儿 乎 所 有 的 AI 问题 都 可 以 被 处 理 。 
下 面 给 出 几 个 例子 。 
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口 序列 预测 。 显 然 ， 索 党 莫 诺 夫 的 序列 预测 可 以 看 作 AIXI 的 特例 ， 所 以 AIXI 
拥有 序列 预测 的 功能 , 像 股 票 走势 、 天 气 预 报 、 彩 票 投注 之 类 的 问题 都 可 以 转 
化 为 类 似 的 序列 预测 问题 ， 只 要 现实 世界 中 这 些 问 题 真 的 是 可 计算 的 ， 那 么 
AIXI 都 可 以 成 功 预测 。 

口 最 优化 。 比 如 寻找 某 个 孔 数 的 最 小 值 问题 ， 这 时 AIXI 可 以 权衡 计算 该 函数 的 
所 有 程序 ， 然 后 只 要 把 AIXI 的 效用 肾 数 设 为 跟 上 日 变量 的 函数 值 相关 的 某 个 哨 
数 就 好 了 。 阴 数值 越 小 效用 越 高 ， 为 了 寻求 最 大 效用 ，AIXI 会 日 动 寻找 消 数 
的 最 小 值 。 计算 经 过 所 有 城市 路 途 最 短 的 旅行 商 问 题 、 求 解 生 产 某 产 品 的 最 小 
成 本 问题 等 都 属于 此 类 问题 。 

口 胰 略 博 弈 。AIXI 还 可 以 进行 各 种 策略 博弈 ， 只 需要 把 博 硬 的 另 一 方 看 作 “ 环 
境 ” 就 好 了 ， 比 如 象棋 之 类 的 二 人 零 和 游戏 。 而 且 ， 如 果 对 手 是 “理性 人 ”的 
话 ，AIXI 的 期 望 最 大 化 策略 会 收敛 到 通常 的 极 小 极 大 化 策略 。 传 统 的 博弈 理 
论 只 能 处 理 理性 主体 间 的 博弈 , 如果 博 奔 的 另 一 方 有 一 些 非 理性 的 行为 ， 只 要 
这 些 行为 仍然 具备 某 种 模式 ， 那 么 AIXI 都 可 以 探索 出 来 ， 然 后 加 以 利用 ， 从 
而 谋 利 。 也 就 是 说 ，AIXI 可 以 对 抗 有 限 理性 或 非 理 性 玩家 。 

口 监督 学 习 。 给 定 一 系列 (z fz))，AIXI 可 以 轻易 地 预测 (z', ?)， 所 以 监督 学 习 也 
很 容易 处 理 。 比如 识别 物体 的 属性 和 根据 属性 分 类 的 问题 都 可 以 划 归 为 这 种 样 
式 。 比 较 复 杂 一 点 儿 的 如 给 定 一 些 状 态 , 然后 教 它 在 合适 的 状态 下 做 合适 的 动 
作 , 这 意味 看 给 定 一 个 (state, action) 序 列 , 然后 AIXI 就 可 以 学 会 遇 到 什么 状态 
该 采取 什么 行动 了 。 诸 如 此 类 的 几乎 所 有 问题 都 可 以 划 归 为 AIXI 能 处 理 的 问 
题 , 与 智能 相关 的 各 种 要 素 也 都 应 该 可 以 从 中 涌现 出 来 。 这 里 最 关键 的 还 是 对 
环境 的 压缩 问题 ， 而 压缩 包含 着 对 任何 模式 的 探索 , 一 般 来 说 具体 的 问题 往往 
只 是 针对 某 些 或 某 类 具体 的 模式 。 


智能 的 定义 与 测量 

从 图 灵 提 出 图 灵 测 试 开始 ， 人 工 智能 专家 们 提出 了 各 种 对 智能 的 定义 或 测试 方 
式 ， 肖 恩 ' 莱 格 外 对 此 进行 了 细致 的 调查 分 析 ， 然 后 与 胡 特 一 起 提出 了 对 智能 的 理 
解 一 一 智能 就 是 在 各 种 各 样 的 纷繁 复杂 的 环境 中 实现 目标 的 能 力 。 

一 个 主体 在 与 环境 4 的 交互 过 程 中 可 以 获得 的 期 望 效用 记 为 V7 ,依照 对 各 种 环 
境 的 通用 先 验 ， 主 体 x 适应 各 种 环境 能 力 的 智能 或 通用 智能 即 为 通用 先 验 下 对 VV 的 
期 望 。 
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以 前 对 智能 的 定义 和 测试 都 是 非 形式 化 的 , 莱 格 和 胡 特 第 一 次 给 出 了 对 智能 的 形 
式 化 定义 。 根据 AIXI 的 定义 和 莱 格 和 胡 特 对 智能 的 定义 , AIXI 可 以 获得 最 高 的 智能 ， 
AIXI 是 一 个 超级 智能 体 。 


正如 算法 概率 可 以 看 作 各 种 归纳 系统 的 黄金 标准 ，AIXI 可 以 看 作 各 种 智能 系统 
的 黄金 标准 ， 其 他 所 有 智能 体 的 智能 客 应 该 是 对 最 高 智能 的 通 近 。 


图 5-14 展示 了 智能 的 定义 与 测量 , 其 中 纵 轴 是 已 有 的 比较 车 名 的 智能 定义 与 测量 
标准 ,， 横 轴 表 示 一 个 好 的 智能 定义 或 测量 标准 应 该 具有 的 性 质 。 可 以 看 出 ，AIXI 有 具备 
各 种 理论 上 的 优点 ， 但 缺点 是 不 具备 实用 性 ， 这 是 由 其 不 可 计算 性 导致 的 。 这 个 缺点 
是 否 有 办 法 元 服 呢 ? 


友 = 是 ,*= 否 ， 
:= 有 争议 的 
?= 未 知 的 
智能 测试 


图 灵 测 试 

全 图 灵 测 试 

反 图 灵 训 | 试 
Toddler 图 灵 测 试 
语言 复杂 性 

文本 压缩 测试 

图 灵 比 

心理 测量 人 工 智 能 
中 密斯 测试 

C 测 试 

通用 (7),AIXI 


才 站 站 站 站 站 站 。 
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通用 智能 主体 AIXI 的 逼近 与 变种 


所 有 模型 都 是 错 的 ， 但 有 些 是 有 用 的 。 
—— George E. P. Box 
AlXI 的 远近 


我 们 在 上 一 节 见识 了 AIXI 及 其 变种 各 种 理论 上 的 最 优 性 质 ， 但 它 究 意 有 没有 实 
用 价值 呢 ? 首先 来 看 一 种 对 AIXI 的 粗暴 的 逼近 ， 对 图 5-12 中 的 期 望 最 大 化 树 进行 暴 


CC 
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力 截 校 ， 只 往 前 看 固定 的 几 步 ， 仅 考 愿 上 只 依赖 于 过 去 儿 步 记忆 的 马尔 可 夫 环 境 ， 然 后 
在 不 告知 游戏 规则 的 情况 下 让 处 理 后 的 AIXI 重复 玩 办 徒 困 境 ( Prisoner’s Dilemma ) 、 
猪 鹿 博弈 〈StagHunt ) 、 斗 鸡 博 畦 (Chicken ) 、 性 别 战 争 ( Battle of Sexes ) 和 猜 便 币 
(Matching Pennies ) 等 简单 的 游戏 ， 发 现 它 仍 能 较 好 地 预测 对 手 的 策略 ， 获 得 令 人 满 
意 的 效果 。 图 5-15 是 AIXI 重复 办 徒 博弈 示意 图 。 

有 一 种 限制 可 能 的 环境 类 通过 索 特 卡 洛 方法 和 上 下 文 树 加 权 方 法 而 作出 的 逼近 
MCAIXILCTW 1 ( 见 图 5-16 ) 具有 更 好 的 效果 ， 它 可 以 在 事先 不 知道 游戏 规则 的 情 
况 下 ， 通 过 试 错 法 玩 好 Cheese Maze 、Tic Tac Toe、Pacman 、Kuhn Poker 等 各 种 稍微 
复兴 的 游戏 ( 见 图 5-17 ) 。 
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N 
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图 5-15 “如 果 对 手 随机 选择 背叛 或 合作 , AIXI 可 以 很 快 发 现 对 手 的 策略 从 而 选择 持 
续 背 叛 ; 如 果 对 手 采用 以 牙 还 牙 策略 ， 则 AIXI 很 快 会 倾向 于 乖乖 合作 


… 过 去 4 ”观察 /回报 《动作 


记录 环境 反馈 信息 


Nam 
MC-AIXI-CTW 


精炼 环境 模型 AIXI 的 二 种 逼近 7 


更 新 贝 叶 斯 混合 信念 [ 2 
J fi 昆 合 信念 
CD CY 
EC || 
用 未 


简单 大 
高 先 验 低 先 验 


5-16 MC-AIXI-CTW 
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藻 回 导 愉 避 舱 


一 一 Optimal 
一 全 一 Cheese Maze 


Tiger 
[VNH 二 HH] 一 4x4Grid 
一 一 TicTacToe 
一 一 Biased RPS 
一 全 一 Kuhn Poker 


Pacman 经 全 
100 1000 10000 100000 1000000 
图 5-17 ”在 事先 不 知道 具体 领域 知识 的 情况 下 ， 同 一 个 主体 可 以 自动 适应 各 种 环境 


AIXI 的 每 一 步 决 策 都 依赖 于 其 过 去 的 历史 ， 现 实 世 界 虽 然 复 杂 但 也 没有 那么 复 
杂 , 其 中 存在 很 多 相对 独立 的 模式 ， 只 依赖 它们 就 可 以 进行 很 好 的 预测 , 因此,， 胡 特 一 
提出 了 “特征 加 强 学 习 ” 的 通 近 方法 ， 通 过 一 种 类 似 极 小 描述 长 度 原则 的 思想 ， 可 以 
将 主体 的 历史 目 动 映射 到 合适 的 状态 上 。 虽 然 这 一 步 很 困难 ， 但 只 要 这 一 步 解 决 了 ， 
就 可 以 将 难处 理 的 通 近 问题 划 归 到 相对 人 简单 的 马尔 可 夫 决 策 过 程 上 。 如 采 处 理 的 现实 
问题 是 简单 的 , 那么 通过 这 种 方法 就 能 自动 找到 一 个 简单 的 马尔 可 夫 决 策 过 程 去 刻画 
它 。 在 一 些 游戏 上 ， 这 种 方法 可 以 取得 不 了 还 于 MC-AIXI-CTW 的 实验 效 末 。 


AIXI 的 变种 


在 AIXI 的 框架 中 ， 主 体 和 环境 可 以 看 作 两 个 完全 独立 的 主体 在 交互 ， 这 是 为 了 
易于 处 理 问 题 而 进行 的 人 简化， 现实 世界 往往 更 加 复杂 ， 主 体 并 不 具有 游离 环境 之 外 的 
超越 地 位 ， 主 体 也 是 环境 的 一 部 分 ， 主体 的 计算 资源 受到 环境 的 时 空 限制 , 为 了 刻画 
这 些 复杂 的 情形 ，AIXI 的 各 种 变种 应 运 而 生 。 


根据 效用 函数 和 贴现 函数 的 不 同 ，AIXI 可 以 有 儿 种 不 同类 型 的 变种 。 根 据 能 否 
读 取 和 修改 日 酉 源 代码 、 内 存 以 及 环境 能 否 读 取 和 修改 主体 的 源 代码 等 ,又 可 以 定义 
几 种 不 同 的 变种 ， 这 主要 是 Orseau ”… 等 人 发 展 的 。 以 下 是 AIXI 的 几 个 变种 。 


口 加 强 学 习 的 主体 。 对 于 加 强 学 习 的 主体 来 次 ,效用 是 它 外 部 感知 的 一 部 分 ， 明 
特 员 最 开始 提出 的 AIXI 就 是 一 种 加 强 学 习 的 主体 。 

口 追逐 目标 的 主体 。 对 于 追逐 目标 的 主体 来 次 ,效用 很 单纯 ， 只 要 在 规定 的 时 刻 
完成 目标 效用 就 是 1， 否则 就 是 0。 
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口 专职 预测 的 主体 。 对 于 专职 预测 的 主体 来 说 ,效用 冰 数 也 很 单纯 ， 如 采 成 功 预 
测 环境 下 一 步 的 反馈 ， 效用 就 是 1， 否则 为 0。 

口 寻求 知识 的 主体 。 寻求 知识 的 主体 是 最 有 意思 的 一 类 变种 , 它 的 效用 不 是 外 部 
环境 赋予 的 ,而 是 自发 驱动 的 , 纯粹 是 为 了 追求 好 奇 。 这 种 主体 纯 为 探索 模式 
而 生 ， 所 以 对 它 来 说 ， 往 往 不 存在 传统 的 探索 /开发 〈exploration/exploitation ) 
两 难 ， 探 索 就 是 开发 ， 因 此 它 是 弱 渐 进 最 优 的 。 

口 自修 改 源 代 码 的 主体 。 如 图 5-18 所 示 ， 上 自修 改 源 代码 的 主体 由 两 部 分 组 成 : 
它 目 身 的 源 代 码 以 及 源 代码 的 执行 硕 。 代 码 执行 融 将 源 代码 作用 于 当前 历史 并 
产生 一 个 输出 ， 这 个 输出 由 一 个 动作 和 下 一 版 目 己 将 要 变 映 的 源 代 但 构成 。 


观察 


源 代码 


动作 
5-18 ”修改 自身 源 代码 的 AIXI 


口 可 修改 和 被 修改 源 代 码 和 内 存 的 主体 。 一 个 能 够 进行 自我 欺骗 的 自修 改 源 代码 
的 主体 有 一 个 欺骗 箱 (如 图 5-19 所 示 ) ， 可 以 对 环境 反馈 回来 的 输入 进行 修 
改 , 而且 环境 也 有 办 法 对 主体 想 升级 的 源 代码 进行 修改 。 有 意思 的 是 ， 对 于 寻 
求知 识 的 AIXI 变种 ， 即 使 环境 可 以 修改 它 的 代码 ， 即 使 允许 它 可 以 自己 修改 
观测 数据 ， 它 也 不 会 进行 自我 欺骗 。 


世界 


源 代码 
5-19 ”自我 欺骗 的 AIXI 


口 只 为 求 存 的 主体 。 只 为 求 存 的 主体 的 效用 函数 很 简单 ,如 采 能 保持 初始 的 源 代 
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人 码 不 变 ， 其 效用 就 为 1， 否则 为 0。 

口 内 藤 时 空 的 主体 。 如 图 5-20 所 示 ， 对 于 内 散 时 空 的 主体 来 说 ， 它 完全 是 环境 
的 一 部 分 ,环境 可 以 修改 主体 的 任何 部 分 。 环境 执行 主体 的 代码 , 它 的 第 一 步 
可 以 是 人 为 限定 的 某 个 不 超过 固定 长 度 的 程序 , 后 面 主体 怎么 改变 就 完全 由 环 
境 控制 了 ,下 一 方 的 哥 德 尔 机 外 可 以 看 作 这 种 内 骸 时 空 的 可 修改 源 代码 的 主体 


的 一 例 。 
主体 : 
内 存 + 源 代码 
图 5-20 ”内 嵌 于 时 空 的 AIXI 
哥 德 尔 机 


抽象 地 看 ,一 个 智能 体 无 非 是 一 段 程序 , 所 以 不 妨 设计 某 种 元 程序 负责 搜索 整个 
程序 空间 、 自 动 寻找 聪明 的 程序 ， 然 后 通过 经 验 学 习 寻 找 更 聪明 的 程序 。 胡 特 : 在 定 
义 这 种 元 程序 时 借鉴 了 莱 文 ”的 通用 搜索 思想 ， 给 出 了 AIXI 的 变种 AIXI*， 限定 在 在 
时 间 太 空间 7 上 , 它 〈 在 乘 上 一 个 很 大 的 稼 数 界 内 ) 理论 上 优 于 任何 其 他 限定 在 时 间 
1、 空 间 7 上 的 智能 主体 。Schmidhuberb 把 AIXLT 进一步 改进 ， 定 义 了 哥 德 尔 机 ， 它 可 
以 进一步 缩小 AIXI 的 常数 界 。 哥 德 尔 机 包含 两 个 并 行 运行 的 部 分 Solver 和 Searcher: 
Solver 负责 与 环境 交互 ， 尽 可 能 最 大 化 期 望 累积 效用 ; Searcher 内 般 了 一 个 形式 系统 ， 
形式 系统 里 有 对 Solver 、Searcher 、 歼 用 上 数 的 完全 摘 述 以 及 对 环境 的 部 分 描述 ， 
Searcher 可 以 对 哥 德 尔 机 各 部 分 (包括 Solver 和 Searcher 目 刁 ) 的 源 代 人 码 进行 彻底 的 修 
改 , 条 件 是 它 内 骸 的 形式 系统 的 定理 证 明 兹 能 证 明 “ 修 改 后 的 主体 在 未 来 的 时 间 里 将 获 
得 比 现 在 更 大 的 期 望 累积 效用 ”。 这 在 一 定 程度 上 保证 了 对 源 代 码 的 修改 是 相对 安全 的 。 
这 样 Solver 和 Searcher 就 可 以 比较 安全 地 不 断 目 我 进化 升级 、 趋 回 最 优 。 但 是 ， 既 然 内 
骨 了 形式 系统 , 它 就 面临 哥 德 尔 不 完全 性 定理 的 障碍 ， 有 一 些 重 要 卓 必 要 的 “ 变 身 ”可 
能 无 法 被 形式 系统 找到 。 

当前 的 主体 技 穷 的 时 候 ， 人 们 总 寄 希 望 于 进化 的 力量 , 希望 演化 后 的 主体 能 更 强 
大 。 对 于 哥 德 尔 机 玉 说 ， 只 要 每 一 代 给 下 一 代 关 配 更 强 的 形式 系统 ， 那 么 不 完全 性 定 
理 的 障碍 就 可 以 突破 ， 但 问题 是 ， 根 据 哥 德尔 不 完全 性 定理 ， 主 体 1 在 构造 主体 2 时 
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如 朱 不 能 在 自己 的 形式 系统 内 证 明 主 体 2 形式 系统 的 一 致 性 , 那么 它 根 本 无 法 保证 主 
体 2 的 可 靠 性 。 无 法 保障 可 牧 性 ， 就 无 法 回避 完全 贡 埋 的 风险 ， 也 驶 意味 春 机 天 智能 
的 伦理 问题 得 不 到 保障 。 但是， 如 果 要 求 每 一 代 主 体 必须 严格 证 明 下 一 代 主 体 的 形式 
系统 的 一 致 性 ,那么 ， 这 种 进化 在 茶 种 意义 上 是 一 种 退化 。 生 物 的 进化 不 需要 一 致 性 
的 保证 ， 好 的 变 寞 、 不 好 的 变 寞 都 可 能 产生 。 目 然 选 择 的 结 来 常常 (但 不 必然 ) 是 优 
胜 劣 汰 ， 变 寞 和 目 然 选择 不 能 保证 可 和 性 ， 哥 德尔 机 面临 的 也 是 同样 的 问题 。 退 一 步 
讲 ， 即 使 不 谈 演化 ， 如 果 把 外 部 世界 看 作 一 个 大 的 形式 系统 ,那么 ， 哥 德尔 机 内 裔 
的 形式 系统 7 的 证 明 能 力 需 要 严格 强 于 7'。 因 为 了 试图 模拟 刀 ， 就 必须 比 了 演化 得 快 
才 有 意义 ， 只 有 在 一 个 严格 强 于 7 的 系统 里 ， 对 于 同样 的 命题 的 最 短 证 明 长 度 才 会 短 
于 在 7 里 的 证 明 长 度 。 也 就 是 次 ， 一 方面 ， 从 表达 力 和 证 明 踢 度 上 说 ， 现 实 世 界 7 
可 以 看 作 模 拟 世 界 7 的 子 系统 ， 为 一 方面 ， 模 拟 世 界 了 又 是 现实 世界 7 的 一 部 分 ，7 
必须 可 以 通过 编码 方式 舱 入 到 现实 世界 7T' 中 。 但 是 ,只 要 强 系 统 7 了 可 以 编码 到 弱 系 统 
7' 中 ， 只 要 这 种 编码 舱 入 可 行 ， 那么 ,第 二 不 完全 性 定理 就 无 法 绕 过 , 7 目 身 的 可 靠 
性 也 得 不 到 保障 。 


抛 开 智能 的 可 靠 性 不 谈 ,， 退 一 步 看 ， 哥 德尔 不 完全 性 定理 的 幽灵 是否 仍 对 通用 智 
能 的 发 展 设置 了 障碍 ? 


通用 智能 与 不 完全 性 定理 


关于 这 个 世界 ， 最 不 可 理解 的 是 一 一 它 竞 是 可 以 理解 的 。 
一 一 阿尔 伯 特 .发 因 斯 坦 


有 些 人 倾 问 于 相信 ， 现 实 世 界 不 是 可 计算 的 ， 它 不 比 算术 模型 简单 ， 总 有 些 真 理 
我 们 不 能 以 完全 形式 化 的 方式 把 握 ， 哥 德尔 不 完全 性 定理 为 人 工 智能 设置 了 障碍 。 但 
如 果 现 实 世 界 是 可 计算 的 呢 ? 如 果 智 能 不 需要 不 可 计算 性 呢 ? 如 果 对 不 可 计算 的 
AIXI 的 某 种 可 计算 的 逼近 也 可 以 涌现 出 智能 现象 呢 ? 不 完全 性 定理 是 否 仍然 对 人 工 
智能 的 实现 构成 威胁 ? 


我 们 可 以 轻易 枚 举 并 模拟 任何 可 能 的 计算 模式 ,如 果 志 界 本 里 是 可 计算 的 ,那么 
原则 上 没什么 是 我 们 不 可 理解 的 。 而 且 , 在 混沌 和 分 形 中 我 们 也 曾 多 次 见识 到 了 简单 
程序 生成 表 观 复杂 现象 的 神奇 ， 我 们 是 不 是 可 以 乐观 地 猜测 ， 在 这 个 五 彩 组 纷 的 世界 
育 后 起 决定 作用 的 程序 也 异 帝 简单 呢 ? 这 里 表 观 复杂 的 现象 只 要 有 简单 的 生成 机 制 ， 
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按照 算法 复杂 性 的 定义 ， 它 仍然 是 简单 的 。 但 如 采 它 稍微 复杂 一 些 ， 依 照 Chaitin 版 
本 的 不 完全 性 定理 "“， 形 式 系统 就 可 能 无 法 帮助 我 们 区 分 它 究 竟 是 复杂 还 是 简单 ， 是 
真 随机 还 是 伪 随 机 。 世 界 是 可 计算 的 是 种 假设 ， 对 于 任何 可 计算 的 世界 ,算法 概率 神 
可 以 很 好 地 遇 近 它 ， 为 了 保证 可 以 各 近 任何 可 计算 世界 的 这 种 通用 性 ， 算 法 概率 本 号 
不 是 可 计算 的 。 如 末 我 们 限制 要 通 近 的 环境 的 类 ， 有 没有 采种 可 计算 的 通用 模型 可 以 
台 近 所 有 算法 复杂 性 不 超过 的 环境 呢 ? 对 于 任何 复杂 性 水 平 x， 这 种 可 计算 的 通用 
模型 都 是 存在 的 ， 但 胡 特 的 学 生肖 恩 ' 莱 格 证明， 这 种 模型 本 身 的 算法 复杂 性 也 不 
会 小 于 ms。 也 就 是 说 ， 只 有 目 身 也 足够 复杂 的 模型 才能 具有 茶 种 水 平 的 “通用 性 ”。 
要 想 具 备 强 大 的 智能 ， 上 自身 必须 达到 一 定 的 复杂 性 ， 和 奢求 通过 极度 简单 的 程序 应 付 任 
何 复杂 环境 的 希望 注 定 洛 空 。 


羔 格 还 证 明了 一 个 类 似 Chaitin 版 本 的 不 完全 性 定理 ( 见 图 5-21 ) : 对 于 任何 包 
含 初等 数论 的 形式 系统 7， 存 在 某 个 复杂 性 水 平 c<， 对 于 任何 局 于 c 的 复杂 性 水 平 n， 
形式 系统 了 午 无 法 帮助 我 们 找到 可 以 通 近 任何 复杂 性 不 超过 半 的 环境 的 通用 模型 ， 尽 
管 这 种 模型 是 确实 存在 的 。 不 严格 地 说 ， 强 大 的 智能 体 必 然 复 杂 ， 复 杂 且 强大 的 智能 
体 是 存在 的 ,但 只 要 它 足 够 复杂 ， 形 式 系统 将 无 法 帮助 我 们 找到 它 。 


? 过 


? ; ? 
复杂 算法 哥 德 尔 不 完全 性 定理 
? ?7 7? 
,> 
弱 可 证 算法 | ? 。 ? 
? 
不 可 能 存在 这 种 算法 


向 单 算 法 


形式 系统 可 证 算法 上 界 ” 强 智能 


弓 智 能 
鸡 千 月 已 Em 有 


图 5-21 不 完全 性 定理 的 制约 : 强大 的 智能 体 本 身 必然 复杂 ; 对 于 任何 形式 系统 ， 
都 存在 一 个 珊 限 ， 足 够 复杂 且 强 大 的 智能 体 是 存在 的 ， 但 此 形式 系统 无 法 
帮助 我 们 找到 


QD chaitin 版 本 的 不 完全 性 定理 : 对 于 任何 包含 初等 数论 的 形式 系统 ,都 存在 某 个 常数 界 , 对 于 复杂 性 
水 平 高 于 这 个 常数 界 的 任何 现象 , 此 形式 系统 都 不 能 告诉 我 们 该 现象 的 复杂 性 水 平 是 否 真 的 高 于 这 
个 常数 界 。 
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通用 归纳 、 通 用 智能 为 人 工 智 能 的 发 展 指明 了 方 回 ， 也 设置 了 上 界 。 如 果 现 实 世 
界 没有 那么 纷 么 复杂 可 能 的 复杂 模式 帮 已 出 现 一 一 或 许 现 实 世 界 真 的 没有 想象 中 那 
么 纷 楷 复杂， 比如 ,一 个 侧 单 的 才 律 分 布 就 能 在 各 种 太 度 上 各 种 环境 中 文 配 春 各 种 看 
上 去 不 相干 的 现象 ， 菏 些 复杂 的 模式 可 能 是 存在 的 ,但 菏 些 复杂 (虽然 是 可 计算 ) 的 
模式 可 能 不 过 是 我 们 数学 上 的 抽象 构造 ,未必 上 真 的 神 会 被 物理 例 示 一 一 那么 ， 算法 概 
座 承 可 以 迅速 地 收敛 到 真实 的 现实 世界 , 有 茶 个 可 计算 且 足 够 蝇 大 能 适应 足够 复杂 的 环 
境 的 智能 体 也 可 能 不 难 找 到 ; 但 如 末 现 实 世 界 确实 包含 高 复杂 度 的 各 种 可 能 的 模式 ， 
那么 ， 人 简单 的 数学 理论 将 帮 不 上 忙 ， 和 寻找 AIXI 的 可 计算 且 高 效 的 台 近 将 是 一 件 艰 巨 
的 任务 。 而 且 ， 对 于 生活 其 中 的 人 来 说 ， 由 于 Chaitin 定理 ， 如 来 复杂 性 高 于 用 个 常 
数 ， 我 们 可 能 无 法 明确 区 分 二 者 。 

除 此 之 外 ，AIXI 还 有 一 个 缺点 ， 虽然 通用 归纳 模型 不 依赖 于 通用 图 灵机 的 选取 ， 
但 AIXI 还 是 依赖 的 。 如 果 售 测 环 境 的 主观 信念 所 依赖 的 通用 图 录 机 与 衡量 乔 能 所 依 
顿 的 通用 图 灵机 不 是 一 个 ,也 网 是 说 ， 如 采 定 义 算 法 概率 时 的 通用 移 验 所 依赖 的 通用 
图 灵机 与 量化 智能 衡量 标准 时 的 通用 先 验 所 依赖 的 通用 图 灵机 不 是 同一 个 ,那么 AIXI 
对 智能 的 追求 可 能 一 开始 就 在 一 个 错误 的 方向 上 。 


总 之 , 一 方面 ,， 虽然 在 满足 形式 系统 的 限制 ， 在 忽略 通用 图 灵机 的 影响 ,在 不 计 
计算 资源 的 情况 下 ， 理 论 上 存在 最 优 的 智能 主体 ， 但 革命 实践 尚未 成 功 ， 长 路 漫漫 ， 
还 需 努 力 ! 另 一 方面 ， 尽 管 AIXI 摆脱 不 了 哥 德 尔 的 幽灵 ， 摆 脱 不 了 通用 图 灵机 的 依 
赖 ， 在 资源 受 限 下 对 其 允 近 也 非 易 事 ,， 但 AIXI 的 整体 框架 还 是 比较 合理 的 一 一 图 灵 
可 计算 性 概念 抓 住 了 物理 世界 有 序 性 的 本 质 , 可 能 世界 /假设 就 是 可 能 的 图 灵机 程序 或 
可 计算 的 测度 ， 枚 举 所 有 可 能 的 假设 ( 伊 壁 鸠 鲁 ) ， 根 据 简单 性 原则 分 配对 各 假设 的 
先 验 信念 〈 奥 卡 姆 剃刀 ) ， 用 贝 叶 斯 方法 更 新 信念 〈 科 学 发 现 过 程 的 体现 ) ， 用 最 大 
化 期 望 累积 效用 的 方法 规划 行为 策略 ( 理性 人 的 选择 ) 一 一 AIXI 的 理论 自身 已 足够 为 
我 们 提供 诸多 指引 。 虽 然 AIXI (及 其 变种 ) 看 上 去 是 一 个 简单 的 模型 ， 但 它 如 此 优 
雅 地 以 显 式 或 隐 式 的 方式 整合 了 目前 人 工 智 能 领域 的 方方面面 , 如 主体 、 效 用 、 概 率 、 
假设 、 不 确定 性 、 归 纳 、 压 缩 、 预 测 、 规 划 与 决策 、 简 单 性 与 复杂 性 、 泛 化 与 过 拟 合 、 
知识 表示 与 存储 、 环 境 建 模 、 逮 辑 定 理 证 明 、 搜 索 与 优化 、 内 在 驱动 、 增 量 学 习 、 控 
索 与 开发 、 自 我 升级 等 ， 对 AIXI 的 深入 研究 必 将 推动 通用 人 工 智能 的 发 展 。 


限于 篇 幅 , 本 章 主要 介绍 了 AIXI 育 后 的 哲学 思想 , 想 要 详细 了 解 AIXI 及 其 变种 
的 各 种 最 优 性 质 及 详细 证 明 的 读者 ， 请 参考 胡 特 -以 及 本 章 的 参考 文献 。 
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第 6 和 卫 深度 学 习 : 大 效 据 时 代 的 


人 工 闪 能 新 途径 


2012 年 6 月 ,4 纽约 时 报 》 少 披露 了 “谷歌 大 脑 ” 项 目 ， 引 发 了 公众 的 广泛 关注 。 
这 个 项 目 由 著名 的 斯 坦 福 大 学 机 带 学 习 教 授 吴 恩 达 (Andrew Ng ) 和 大 规模 计算 机 系 
统 方面 的 世界 顶尖 专家 杰 夫 … 迪 恩 (JeffDean ) 共同 主导 ， 用 16 000 个 CPU Core 的 
并 行 计算 平台 训练 一 种 称 为 深层 神经 网 络 ( Deep Neural Networks，DNN ) 的 机 融 学 
习 模 型 ， 在 图 像 识 别 等 领域 获得 了 巨大 的 成 功 。 有 人 舍 计 ， 这 个 人 工大 脑 的 智商 ， 
已 经 相当 于 2 岁 孩 子 的 水 平 。2012 年 11 月 ， 微 软 在 天 津 的 一 次 活动 上 公开 演示 了 一 
个 全 自动 的 同 声 传译 系统 ， 讲 演 者 用 英文 演讲 ， 后 台 的 计算 机 上 自动 完成 语音 识别 、 
英 中 机 和 融 翻 译 以 及 中 文 霹 音 合 成 , 效 末 非常 流畅 。 据 报道 , 文 撑 的 关键 技术 也 是 DNN， 
或 者 深度 学 习 。2013 年 1 月 ， 百 度 宣 布 成 立 首 个 研究 院 ， 其 中 人 第 一 个 重点 方向 束 是 
深度 学 习 ， 因 此 命名 为 Institute of Deep Learning ( IDL )。2013 年 4 月 ， 厅 省 理工 学 
院 《 技 术 评论 》 困 志 将 深度 学 习 列 为 2013 年 十 大 突破 性 技术 之 首 。 可 以 说 ， 深 度 学 
习 旋 来 了 机 融 学 习 的 新 浪 漳 ， 推 动 了 大 数据 + 深度 模型 时 代 的 来 临 ， 也 推动 了 人 工 智 
能 和 人 机 交互 大 踏步 前 进 。 


那么 , 什么 是 深度 学 习 ? 为 什么 深度 学 习 受 到 学 术 界 和 工业 界 如 此 的 重视 ” 深 度 
尝 习 扩 术 研发 面临 什么 样 的 科学 和 工程 问题 ? 本 章 将 为 你 揭 开 深度 学 习 的 神秘 面纱 。 
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历史 回顾 : 神经 网 络 的 前 世 今 生 


在 解释 次 度 学 习 之 前 ,我 们 需要 了 解 什么 是 机 需 学 习 。 机 需 学 习 是 人 工 智能 的 一 
个 分 文 ， 很 多 时 候 几 乎 成 为 人 工 稚 能 的 代名词 。 简 单 来 说 ， 机 融 学 习 承 是 通过 算法 ， 
使 得 机 器 能 从 大 量 历史 数据 中 学 习 规 律 ， 从 而 对 新 的 样本 做 智能 识别 或 对 未 来 做 预 
测 。 从 20 世纪 80 年 代 末 ， 机 硕 学 习 的 发 展 大 致 经 历 了 两 次 浪潮 : 浅 层 学 习 ( shallow 
learning ) 和 次 上 度 学 习 ( deep learning )。 


第 一 个 神经 元 模型 是 麦 卡 洛克 和 匹 效 在 1943 年 提出 的 中， 称 为 闽 值 逻辑 
(threshold logic )， 它 可 以 实现 一 些 逻 辑 运 算 的 功能 。 目 此 以 后 ， 神 经 网 络 的 研究 分 
化 为 两 个 方 癌 ， 一 个 专注 于 和 后 物 信息 处 理 的 过 程 ， 称 为 生物 神经 网 络 ; 一 个 专注 于 
工程 应 用 ， 称 为 人 工 神 经 网 络 。 本 和 曹 主要 介绍 后 者 。1958 年 罗 条 布 拉 特 提出 了 感知 
机 , 它 本 质 上 是 一 个 线性 分 类 器 。1969 年 六 斯 基 和 派 珀 特写 了 一 本 书 《 感 知 机 》 
他 们 在 书 中 指出 : 单 层 感知 机 不 能 实现 XOR 功能 ; 计算 机 能 力 有 限 ， 不 能 处 理 神经 
网 络 所 需要 的 长 时 间 运 行 过 程 。 鉴 于 冈 斯 基 在 人 工 智 能 领域 的 影响 力 一 一 他 是 人 工 
智能 的 奠基 人 之 一 , 也 是 著名 的 MIT CSAIL 实验 室 的 黄 基 人 之 一 , 并 于 1969 年 获得 
图 灵 奖 一 一 这 本 书 令 人 工 神 经 网 络 的 研究 进入 了 长 达 10 多 年 的 “冬天 ”。 事实 上 ,如 
果 把 单 层 感知 机 堆 成 多 层 ( 称 为 Multilayer Perceptron，MLP， 如 图 6-1 所 示 )， 是 可 
以 求解 线性 不 可 分 问题 的 ， 但 当时 缺乏 有 效 的 算法 。 尽 管 1974 年 哈佛 大 学 的 博士 生 
保罗 沃 博 斯 提出 了 比较 有 效 的 反 回 传播 算法 〈 侧 称 BP 算法 )， 但 没有 引起 学 界 的 
重视 。 直 到 1986 年 大 卫 : 鲁 姆 哈 特 和 他 的 学 生 溯 顿 等 人 重新 发 现 这 一 算法 ， 并 在 
Nature 上 发 表 ， 人 工 神经 网 络 才 再 次 受到 重视 。 


n 
、 本 » 
第 一 个 隐 含 层 ”第 二 个 隐 含 层 


6-1 多 层 感 知 机 
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BP 算法 的 发 明 给 AI 研究 市 来 了 而 望 ， 掀 起 了 基于 统计 模型 的 机 带 学 习 热潮 。 这 
个 热潮 一 直 持续 到 今天 。 人 们 发 现 ， 利 用 BP 算法 可 以 让 一 个 人 工 神 经 网 络 模型 从 大 
量 训练 样本 中 学 习 出 统计 规律 ， 从 而 对 未 知事 件 进 行 预测 。 这 种 基于 统计 的 机 融和 学习 
方法 比 起 过 去 基于 人 工 规 则 的 系统 ,在 很 多 方面 显示 出 了 优越 性 。 这 个 时 候 的 人 工 神 
经 网 络 ， 虽 然 也 被 称 作 多 层 感 知 机 《Mnulti-layer Perceptron )， 但 实际 上 是 一 种 只 含有 
一 层 隐 层 节 操 的 浅 层 模型 。 


20 世纪 90 年 代 ， 弗 拉 基 米尔 ' 万 普 尼 克 等 人 提出 了 支持 癌 量 机 (SVM ) ”。 虽 
然 SVM 本 质 上 是 一 种 特殊 的 两 层 神 经 网 络 ， 但 因 其 具有 高 效 的 学 习 算 法 ， 且 没有 局 
部 最 优 的 问题 ， 使 得 很 多 神经 网 络 的 研究 者 转 癌 了 它 。 随 后 ， 各 种 各 样 的 浅 层 机 融 学 
习 模 型 相继 被 提出 ， 比 如 Boosting、 最 大 燃 方 法 (例如 Logistic Regression ) 等 。 这 些 
模型 的 结构 基本 上 可 以 看 成 市 有 一 层 隐 层 节点 (如 SVM、Boosting ) 或 没有 隐 层 节点 
(如 逻辑 回归 )。 这些 模 型 无 论 是 在 理论 分 析 上 还 是 应 用 上 都 获得 了 巨大 的 成 功 。 相 比 
之 下 ， 由 于 理论 分 析 的 难度 ， 加 上 训练 方法 需要 很 多 经 验 和 技巧 ， 所 以 这 个 时 期 多 层 
前 馈 神经 网 络 的 人 研究 逐渐 变 得 冷清 。 只 有 一 位 执着 的 老 先生 ， 就 是 参与 发 明 BP 算法 
的 六 顿 ， 默 默 地 坚持 了 下 来 。 


直到 2006 年 ， 广 顿 的 研究 终于 取得 突破 ， 提 出 了 深度 网 络 和 深度 学 习 的 概念 ， 

神经 网 络 开始 焕发 一 轮 新 的 生机 ， 并 掀起 了 第 二 次 机 融 学 习 当 潮 。 次 度 网 络 ， 从 字面 
上 理解 就 是 深层 次 的 神经 网 络 。 至 于 为 什么 不 沿用 以 前 的 术语 “多 层 神 经 网 络 ”"， 可 
能 是 为 了 与 以 前 的 神经 网 络 相 区 分 ， 表示 这 是 一 个 新 的 概念 。2006 年 , 立顿 和 他 的 学 
生 Ruslan Salakhutdinov 在 Science 杂志 上 发 表 了 一 篇 文章 趾 , 传达 了 两 个 主要 的 信息 : 
(1) 很 多 隐 层 的 人 工 神经 网 络 具 有 优异 的 特征 学 习 能 力 ， 学 习 得 到 的 特征 对 数据 有 更 
本 质 的 刻画 ， 从 而 有 利于 可 视 化 或 分 类 ; (2) 次 度 神 经 网 络 在 训练 上 的 难度 ， 可 以 通 
过 逐 层 初始 化 ( Layer-wise Pre-training ) 来 有 效 克 服 。 


这 项 工作 重新 燃 起 了 学 术 界 对 于 神经 网 络 的 热情 , 一 大 批 优秀 的 学 者 加 入 到 深层 
神经 网 络 的 人 研究 中 来 , 尤其 是 守 特 利 尔 大 学 的 Bengio 人 赋 究 组 和 斯 坦 福 大 学 的 Ng 研究 
组 。Bengio 人 研究 组 的 一 个 重要 贡献 是 提出 了 基于 自 编码 器 的 深度 学 习 网 络 站 。 而 Ng 
研究 组 的 一 个 重要 贡献 是 提出 了 一 系列 基于 黎 玲 编码 的 深层 学 习 网 络 。 2010 年 ,美国 
防 部 DARPA 计划 首次 资助 深度 学 习 项 目 , 参与 方 有 斯 坦 福 大 学 、 纽 约 大 学 和 NEC 
美国 研究 院 。 文 持 深 度 学 习 的 一 个 重要 依据 ， 就 是 脑 神经 系统 的 确 具有 丰富 的 层次 结 
构 。 一 个 最 著名 的 例子 就 是 Hubel-Wiesel 模型， 他 由 于 揭示 了 视觉 神 经 的 肌理 而 获得 
详 贝 尔 医 学 与 生理 学 奖 。 除 了 仿生 学 的 角度 ， 目 前 次 度 学 习 的 理论 研究 还 基本 处 于 起 
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步 阶 段 , 但 在 应 用 领域 已 显现 出 巨大 的 能 量 。2011 年 以 来 , 微软 研究 院 和 谷歌 的 语音 
识别 研究 人 员 先 后 采用 DNN 技术 降低 语音 识别 错误 率 20%~30% 由 ,是 语音 识别 领域 
十 多 年 来 最 大 的 突破 性 进展 。2012 年 ，DNN 技术 在 图 像 识别 领域 取得 惊人 的 效果 ， 
在 ImageNet 评 测 上 将 错误 率 从 26% 降 低 到 15%1,。 在 这 一 年 ， DNN 还 被 应 用 于 制药 
公司 的 Druge Activity 预测 问题 ， 并 获得 世界 最 好 成 绩 。 


值得 强调 的 是 ， 在 2006 年 之 前 也 有 一 个 学 习 效 率 非 常 高 的 深度 网 络 ( 从 历史 的 
角度 看 , 称 之 为 多 层 神 经 网 络 更 为 合适 ) 一 一 卷 积 神经 网 络 。 这 个 网 络 由 纽约 大 学 的 
严 恩 ' 乐 库 ( Yann LeCun ) 于 1998 年 提出 时， 并 在 图 像 分 类 (包括 手写 体 认 别 、 交 
通 标 志 识 别 等 ) 中 得 到 了 广泛 应 用 。 比 如 在 JCNN 2011 年 的 交通 标志 识别 竞赛 中 ， 
一 组 来 自 瑞士 的 研究 者 使 用 基于 卷 积 神经 网 络 的 方法 一 举 夺 鬼 。 卷 积 神经 网 络 本 质 
上 是 一 个 多 层 感 知 机 ( 如 图 6-2 所 示 )， 那 为 什么 它 能 够 成 功 呢 ? 人 们 分 析 关 键 可 能 
在 于 它 所 采用 的 局 部 连接 和 分 享 权 值 的 方式 不 仅 减 少 了 权 值 的 数量 ， 而 且 降 低 了 过 
拟 合 的 风险 。 


下 采样 层 下 采样 层 
图 6-2 卷 积 神经 网 络 的 结构 
机 桥 学 习 的 两 次 浪潮 痢 和 时 代 的 发 展 紧 密 相关 。 如 琳 说 25 年 前 BP 神经 网 络 掀起 
的 第 一 波 机 带 学 习 浪 泣 使 人 们 第 一 次 认识 到 基于 统计 的 方法 比 起 过 去 基于 人 工 规则 
的 系统 的 优越 性 , 那 今天 谷歌 、 微 软 、 百 度 等 拥有 大 数据 的 高 科技 公司 争 相 投入 货源 ， 
语 领 深度 学 习 的 技术 制高点 ， 则 是 因为 它们 都 看 到 了 在 大 数据 时 代 ， 更 加 复杂 上 且 更 加 
强大 的 深度 模型 能 深刻 揭示 海量 数据 里 所 承载 的 复杂 而 丰富 的 信息 , 并 对 未 来 或 未 知 
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事件 做 更 精准 的 预测 。 


基本 原理 : 从 特征 表示 到 深度 学 习 


考 夸 到 一 般 访 者 的 非 专 业 育 景 ， 本 蔬 将 首先 介绍 机 可 学 习 中 的 特征 表示 问题 ， 以 
及 传统 人 工 设计 特征 存在 的 问题 ,由 此 引出 目 动 学 习 多 层 特征 ， 即 深度 学 习 的 基本 思 
想 ， 然 后 介绍 几 种 最 稼 见 的 浴 度 学 习 模 型 ， 最 后 会 探讨 诛 度 学 习 与 大 数据 的 天 系 。 


特征 提取 和 表示 学 习 


要 理解 深度 学 习 , 首先 要 理解 机 需 学 习 中 的 特征 和 表示 。 用 机 需 学 习 特 定 问 题 时 ， 
一 般 采 集 到 数据 之 后 会 进行 一 些 特 征 提 取 的 处 理 ， 例 如 机 器 视 党 里 的 SIFT 特征 + 词 
袋 模 型 (Bag of Words )， 或 者 语音 识别 里 的 MFCC 频谱 之 类 的 特征 ， 再 把 提取 出 的 特 
征 〈 即 原始 数据 的 一 个 表示 ) 于 到 各 种 机 器 学 习 模 型 (如 SVM ) 里 做 分 类 或 预测 。 
这 些 特征 提取 的 算法 往往 都 是 人 们 根据 该 问题 数据 的 特征 人 工 设计 出 来 的 , 并 且 设 计 
更 好 的 特征 一 直 以 来 是 各 个 领域 里 非常 重要 的 研究 问题 。 在 模型 的 运用 不 出 差错 的 前 
提 下 ， 特 征 的 好 坏 往往 成 为 整个 系统 性 能 的 决定 因素 。 
表示 的 问题 在 机 需 学 习 以 及 相关 领域 中 一 直 是 一 个 非常 重要 的 研究 课题 。 因 为 对 
于 不 同 的 问题 、 不 同 的 数据 和 不 同 的 模型 ， 合 适 的 表示 可 能 会 很 不 一 样 ， 而 找到 正确 
的 表示 之 后 往往 就 可 以 事半功倍 。 为 了 理解 好 的 表示 的 重要 性 ， 我 们 来 看 两 个 例子 。 
大 家 都 知道 乘法 比 加 法 难 算得 多 ， 比 如 9480208 和 302842 的 和 ， 只 要 各 位 对 齐 ， 
一 位 一 位 地 加 并 处 理 好 进位 就 好 了 ， 一般 人 口算 都 没 问 题 ， 但 是 如 果 是 乘法 的 话 ， 将 
难 上 很 多 倍 。 其 实 这 是 因为 我 们 常用 的 数字 的 十 进 制 表 达 偏 癌 于 加 法 计算 。 如 果 我 们 
换 一 种 表达 : 每 一 个 数字 可 以 等 价 地 表达 为 它 的 素数 因子 的 集合 ， 例 如 : 
9480208D {2,2,2,2,131,4523} 
302842 0 {2,53,2857} 
那么 两 个 数 相 乘 就 再 简单 不 过 了 了: 
9480280x302842 0 {2,2,2,2,2,53,131,2857,4523} 
反 过 来 在 这 种 表示 下 做 加 法 就 很 困难 了 。 
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第 二 个 例子 是 一 个 更 贴近 实际 的 简单 图 片 识别 任务 : 识别 一 张 图 片上 是 否 有 岛 。 
如 果 能 预 乞 知 道 乌 的 视 党 特征 ， 例 如 尖 嘴 、 羽 毛 、 翅 膀 等 ， 并 检测 一 幅 图 片上 是 否 包 
含 这 些 特征 ， 作 为 这 幅 图 片 的 表示 例如 如 来 有 尖 嘴 ， 对 应 位 置 为 1， 否则 为 0) 不 
难 想象 ， 在 这 个 新 的 表示 上 识别 ， 比 百 接 在 原始 像素 上 识别 ， 准 确 率 要 总 得 多 。 


传统 的 浅 层 模 型 有 一 个 重要 特点 ， 就 是 徘 人 工 经 验 来 抽取 样本 的 特征 ， 而 强调 模 
型 主要 是 负 员 分 类 或 预测 。 因 此 ， 通 弟 一 个 开发 团队 会 将 更 多 的 人 力 投 入 到 发 掘 更 好 
的 特征 上 去 。 要 发 现 一 个 好 的 特征 ， 殊 要 求 开 发 人 员 对 于 每 解决 的 问题 要 有 很 深入 的 
理解 ， 往 往 需 要 反复 地 摸索 。 因 此 ， 人 工 设计 样本 特征 不 是 一 个 可 扩展 的 途径 。 深 度 
学 习 的 实质 ， 是 通过 构建 具有 很 多 隐 层 的 机 融 学 习 模 型 和 海量 的 训练 数据 ,来 学 习 更 
有 用 的 特征 ， 从 而 最 终 提 升 分 类 或 预测 的 准确 性 。 所 以 “次 度 模 型 ”是 手段 ,“ 表 示 
学 习 ” 才 是 目的 。 座 度 学 习 与 传统 的 线 层 学 习 的 不 同 在 于 : (1) 强调 了 模型 结构 的 次 
度 , 通 首 有 5$ 层 或 6 层 , 甚至 10 多 层 的 隐 层 节点 ; (2) 明确 突出 了 表示 学 习 的 重要 性 ， 
也 就 是 说 ， 通 过 逐 层 特征 变换 ， 将 样本 在 原 空 间 的 特征 表示 变换 到 一 个 新 特征 空间 ， 
使 分 类 或 预测 更 加 容易 。 


目 编码 器 、 受 限 玻 尔 兹 曼 机 和 深度 网 络 


那么 ， 怎 样 从 海量 训练 数据 中 学 习 表 示 ,， 目 动 提取 特征 呢 ? 羊 顿 和 其 他 研究 者 到 
压 提 出 了 一 种 什么 样 的 学 习 方 法 呢 ?” 这 要 从 深度 学 习 的 基本 模块 日 编 公 表 和 受 限 下 
尔 效 曼 机 讲 起 。 


目 编码 器 


目 编 码 带 ( autoencoder ) 是 含有 一 个 隐 层 的 神经 网 络 ( 如 图 6-3 所 示 )。 从 概念 上 
讲 ， 它 的 训练 目标 是 “重新 建立 ”输入 数据 ; 换 句 话说 ， 让 神经 网 络 的 输出 与 输入 是 
同一 样 东西 ， 只 是 经 过 了 了 压缩。 例如， 有 一 个 由 28 x 28 像素 的 灰 度 图 像 组 成 的 训练 
集 ， 且 每 一 个 像素 的 信 都 作为 一 个 输入 层 神 经 元 的 输入 (这 时 输入 层 就 会 有 784 个 神 
经 元 )。 输 出 层 神 经 元 要 有 相同 的 数目 (784 )， 且 每 一 个 输出 神经 元 的 输出 值 和 输入 
图 像 的 对 应 像素 灰 度 值 相同 。 


这 样 ， 神 经 网 络 学 习 到 的 实际 上 并 不 是 一 个 训练 数据 到 标记 的 “上 映射 ” ， 而 是 学 
习 数 据 本 里 的 内 在 结构 和 特征 。 因 此 ， 隐 舍 层 也 被 称 作 特 征 探测 器 (feature detector )。 
通常 隐 含 层 中 的 神经 元 数目 要 比 输入 /输出 层 少 , 这 是 为 了 使 神经 网 络 只 去 学 习 最 重要 
的 特征 并 实现 特征 的 降 维 。 我 们 想 在 中 间 层 用 很 少 的 市 点 在 概念 层 上 学 习 数 据 ， 产 生 
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一 个 条 致 的 表 丰 方法 。 


Po 人 (X ) 


6-3 ”月 编码 器 


为 了 更 好 地 理解 ， 下 面 我 们 再 看 一 个 应 用 。 这 次 我 们 使 用 一 个 简单 的 数据 集 ， 其 
中 包括 一 些 感冒 的 症状 。 数 据 结构 如 下 : 输入 数据 一 共 六 个 二 进 制 位 ， 前 三 位 是 病 的 
症状 。 例 如 ，100000 代表 病人 发 烧 ，010000 代表 咳嗽 ，110000 代表 既 咳嗽 又 发 烧 。 
后 三 位 表示 抵抗 能 力 , 如 果 一 个 病人 有 这 个 , 代表 他 /她 不 太 可 能 患 此 病 。 例 如 , 000100 
代表 病人 接种 过 流感 疫苗 。 一 个 可 能 的 组 合 是 : 010100 ,这 代表 着 一 个 接种 过 流感 疫 
苗 的 咳嗽 病人 。 当 一 个 病人 同时 拥有 前 三 位 中 的 两 位 时 ,我 们 认为 他 生病 了 ; 如 果 至 
少 拥 有 后 三 位 中 的 两 位 ， 那 么 他 是 健康 的 ， 如 : 


111000, 101000, 110000, 011000, 011100= 生病 
000111, 001110, 000101, 000011, 000110 = 健康 


我 们 来 训练 一 个 自 编 码 带 (使 用 反 向 传播 )， 六 个 输入 、 六 个 输出 神经 元 ， 而 只 
有 两 个 隐 仿 神经 元 。 在 经 过 几 百 次 迭 代 以 后 ,我 们 发 现 ， 每 当 一 个 “生病 ”的 样本 输 
入 时 ， 两 个 隐 含 层 神 经 元 中 的 一 个 ( 对 于 生病 的 样本 总 是 这 个 ) 总 是 显示 出 更 遍 的 激 
活 值 。 而 如 果 输 入 一 个 “健康 ”样本 时 ， 为 一 个 隐 含 层 则 会 显示 更 高 的 激活 值 。 


受 限 波 尔 兹 曼 机 


受 限 波 尔 效 曼 机 ( RBM ) 是 一 种 可 以 在 输入 数据 集 上 等 习 概 座 分 布 的 生成 随机 神 
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经 网 络 。RBM 由 隐 含 屋 、 可 见 层 、 偏 置 层 组 成 。 和 前 僻 神 经 网 络 不 同 ， 可 见 层 和 卫 
合 层 之 间 的 连接 无 方 癌 性 〈 信 息 可 以 从 可 见 层 一 隐 含 层 或 隐 含 层 一 可 见 层 任意 传输 ) 
并 且 是 全 连接 的 ， 每 一 个 当前 层 的 神经 元 写 下 一 层 的 每 个 神经 元 部 有 连接 ， 如 图 6-4 
所 示 。 如 果 人 允许 任意 层 的 任意 神经 元 连接 到 任意 层 去 ， 我 们 就 得 到 了 一 个 波 尔 效 受 机 
( 非 受 限 的 )。 标准 的 RBM 中 ， 隐 含 和 可 见 层 的 神经 元 午 是 二 态 的 ， 即 神经 元 的 激活 
值 只 能 是 服从 们 努力 分 布 的 0 或 1。 


隐 单 元 


可 见 单元 


6-4 受 限 玻 尔 兹 曼 机 


算法 的 思想 就 是 在 正 癌 过程 中 影响 了 网 络 内 部 对 于 真实 数据 的 表示 。 同 时 ,反问 
过 程 中 尝试 通过 这 个 被 影响 过 的 表示 方法 重建 数据 。 主 要 目的 是 可 以 使 生成 的 数据 与 
原 数 据 尽 可 能 相似 ， 这 个 差异 影响 了 权重 更 新 。 换 句 话 说 ， 这 样 的 网 络 具 有 了 感知 对 
输入 数据 表示 的 程度 的 能 力 ， 而 且 和 尝试 通 过 这 个 感知 能 力 重建 数据 。 如 果 重 建 出 来 的 
数据 与 原 数 据 差 异 很 大 , 就 要 进行 调整 并 再 次 重建 。RBM 的 权重 更 新 公式 中 包含 正 
学 习 和 道学 习 两 项 ， 其 中 道学 习 项 需要 可 见 层 和 隐 含 层 的 交 蔡 随机 采样 ( gibbs 
sampling )， 耻 至 网 络 达 到 平衡 态 。 但 这 样 计算 很 慢 ， 使 得 模型 只 有 具有 理论 价值 而 
不 够 实用 。 但 这 种 问题 难 不 倒 辛 顿 ， 他 提出 了 一 个 叫 作 对 比 散 度 ( contrastive 
divergence ) 的 近似 方法 ， 只 需 采 样 很 少 的 次 数 (如 1 次 ) 就 可 以 更 新 权重 ,有 晶 对 
最 终 的 学 习 戏 果 几 乎 没有 影响 。 


目 编 码 侣 或 RBM 以 无 监督 的 方式 学 到 数据 中 的 特征 。 最 重要 的 是 ， 上 述 特征 学 
程 是 可 以 从 代 的 ， 我们 可 以 在 已 学 到 的 表示 上 用 同样 的 算法 青学 一 层 新 的 表示 ， 
未 层 训练 ， 学 到 越 来 越 抽象 的 特征 。 下 面 我 们 束 来 看 看 深度 竺 习 的 训练 过 程 。 
诬 上 度 竺 习 与 传统 的 神经 网 络 之 间 妹 有 相同 的 地 方 也 有 很 多 不 同 。 二 者 的 相同 之 处 
在 于 深度 等 习 采 用 了 相似 的 分 层 结构 ， 系 统 由 包括 输入 层 、 隐 层 ( 多 层 )、 输 出 层 组 
成 的 多 层 网 络 ， 只 有 相 邻 层 节 点 之 间 有 连接 ， 同 一 层 以 及 路 层 节点 之 间 相 互 无 连接 。 


习 


过 
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这 种 分 层 结构 是 比较 接近 人 类 大 脑 的 结构 的 。 


在 传统 神经 网 络 中 ， 人 们 采用 的 是 BP 算法 训练 整个 网 络 ， 随 机 设 定 初 值 ， 计 算 
当前 网 络 的 输出 ， 然 后 根据 当前 输出 和 训练 的 标签 之 间 的 差 改 变 前 面 各 层 的 参数 , 直 
到 收敛 ( 整体 是 一 个 梯度 下 降 法 )。 


BP 算法 作为 传统 训练 多 层 网 络 的 典型 算法 ,实际 上 在 仅 含 几 层 网 络 的 时 候 就 已 
经 很 不 理想 了 。 座 度 绪 构 ( 涉及 多 个 非 线 性 处 理 单元 层 ) 的 非 凸 目标 代价 函数 中 普 这 
存在 的 局 部 最 小 是 训练 困难 的 主要 原因 。BP 算法 存在 以 下 几 个 主要 问题 。 
口 标 度 越 来 越 稀 殉 : 从 顶层 越 入 下 ， 误 差 校正 信号 越 来 越 小 ; 
口 收敛 到 局 部 最 小 值 : 尤其 是 从 远离 最 优 区 域 开始 的 时 候 ( 随机 值 初始 化 会 导致 
这 种 情况 的 发 生 ); 
口 一 般 只 能 用 有 标签 的 数据 来 训练 : 但 大 部 分 数据 是 没有 标签 的 ， 而 大 脑 可 以 从 
没有 标签 的 数据 中 学 习 。 


为 了 解决 多 层 神经 网 络 用 传统 BP 算法 难以 训练 的 问题 ， 注 顿 等 人 提出 了 在 非 监 
督 数据 上 建立 多 层 神经 网 络 的 一 个 有 效 方法 : 简单 地 说 ， 分 为 两 步 ， 一 是 每 次 训练 一 
层 网 络 ， 二 是 调 优 。 以 栈 式 目 编码 硕 〈stacked autoencoder， 见 图 6-5 ) 为 例 ， 这 种 网 
络 由 多 个 栈 式 结合 的 自 编码 需 组 成 。 人 第 1 个 目 编 码 需 的 隐 含 层 会 作为 第 !+1 个 目 编 
但 硕 的 输入 层 。 第 一 个 输入 层 就 是 整个 网 络 的 输入 层 。 具 体 训 练 过 程 如 下 。 


一 一 > PO=0lx) 


Co 


p> PP (y=1|x) 


Eo 
a 


pe PP (Y=2|X) 


QQ 


地 
> 
洲 


隐 层 1 隐 层 2 Softmax 分 类 需 


图 6-5 栈 式 自 编码 器 网 络 〈 男 见 彩 插 ) 
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(1) 使 用 目 底 向 上 (图 6-5 的 从 左 回 右 ) 非 监督 和 学习 ， 就 是 从 底层 开始 ， 一 层 一 层 
地 往 顶 层 训 练 。 采 用 无 标定 数据 (有 标定 数据 也 可 ) 分 层 训练 各 层 参数 ， 这 一 步 可 以 
看 作 一 个 无 监督 训练 过 程 ， 也 可 以 看 作 是 特征 学 习 过 程 ， 是 和 传统 神经 网 络 区 别 最 大 
的 部 分 。 


口 通过 BP 方法 利用 所 有 数据 对 第 一 层 的 目 编 码 带 进行 训练 (1 = 1， 图 6-5 中 的 
绿色 连接 部 分 )。 

口 训练 第 二 层 的 目 编码 天 1= 2 〈 红 色 连 接 部 分 ) 上 = 2 的 输入 是 != 1 的 输出 。 
此 时 可 以 将 t= 工 看 作 特征 提取 融 ， 将 原始 数据 变换 为 新 的 表示 《〈 即 4= 1 的 隐 
含 层 ) 后 传 给 1=2 层 训练 。t=2 层 的 权重 仍然 使 用 反 向 传播 的 方法 进行 更 新 。 

口 对 除 最 后 一 层 外 的 其 他 隐 含 层 用 同样 的 方法 训练 。 


(C) 目 项 回 下 (图 6-5 的 从 右 问 左 ) 的 监督 和 学习， 网 是 通过 市 标签 的 数据 去 更 新 所 
有 层 的 权重 ,误差 日 项 癌 下 传输 ， 对 网 络 进行 微调 。 


步骤 (]) 被 称 为 预 训练 , 这 将 网 络 里 的 权重 值 初始 化 至 一 个 合适 的 位 置 。 由 于 这 一 
步 不 是 随机 初始 化 ， 而 是 通过 学 习 输 入 数据 的 结构 得 到 的 ， 因 而 这 个 初 值 更 接近 全 局 
最 优 ， 从 而 能 够 取得 更 好 的 效果 。 但 是 通过 这 个 训练 并 没有 得 到 一 个 输入 数据 到 输出 
标记 的 映射 。 例 如 ， 一 个 网 络 的 目标 是 被 训练 用 来 识别 手写 数字 ， 经 过 这 样 的 训练 后 
还 不 能 将 最 后 的 特征 探测 需 的 输出 〈 即 隐 含 层 中 最 后 的 自 编码 器 ) 对 应 到 图 片 的 标记 
上 去 。 通 常 的 办 法 是 在 网 络 的 最 后 一 层 ( 即 图 6-5 中 蓝 色 连接 部 分 ) 后 面 再 加 一 个 或 
多 个 全 连接 层 。 整 个 网 络 可 以 看 作 一 个 多 层 的 感知 机 ， 并 使 用 BP 方法 进行 训练 。 这 
一 步 即 上 述 训 练 过 程 中 的 步骤 (2)， 也 被 称 为 微调 。 


和 目 编 码 带 一 样 ， 也 可 以 将 波 尔 兹 曼 机 进行 栈 式 营 加 来 构建 深度 信 度 网 络 
(DBN )。 学 好 了 一 个 RBM 模型 后 ,固定 权 值 ， 然 后 在 上 面 驹 加 一 层 新 的 隐 层 单元 ， 
原来 RBM 的 隐 层 变 成 了 它 的 输入 层 , 这 样 就 构造 了 一 个 新 的 RBM, 然后 用 同样 的 方 
法 学 习 它 的 权 值 。 以 此 类 推 , 可 以 又 加 多 个 RBM , 构成 一 个 这 度 网 络 ( 如 图 6-6 所 示 )。 
令 RBM 学 习 到 的 权 值 作为 这 个 深度 网 络 的 初始 权 值 , 再 用 BP 算法 进行 学 习 。 这 就 是 
深度 信念 网 络 的 学 习 方 法 。 


顶层 受 限 | 
| 500 | 玻 尔 兹 曼 机 ; 


名 一 一 一 一 一 一 一 一 一 一 


1000 | 受 限 蓄 尔 
兹 曼 机 ;| 


| 


A A 


om 
. Wy> 8 
| 
尔 效 曼 机 | 


受 限 玻 尔 。 |! 编 双 。 | 
预 训练 兹 曼 机 微调 


6-6 ”深度 信念 网 络 (图片 来 自 文献 ”) 


图 6-6 的 左边 是 一 个 深度 信 度 网 络 的 例子 ， 我们 希望 通过 这 个 网 络 对 图 像 进 行 压 
缩 。 这 个 网 络 有 4 层 ， 将 一 个 高 维 的 图 像 信 号 压缩 到 30 维 ， 即 最 顶层 的 神经 元 个 数 为 
30。 我 们 还 可 以 将 这 个 网 络 对 称 展开 ， 从 30 维 回 到 原来 的 高 维 信号 ， 这 样 就 有 了 一 个 
8 层 的 网 络 ( 见 图 6-6 中 间 ) 如 果 该 网 络 用 于 信号 压缩 , 那么 可 以 令 该 网 络 的 目标 输出 
等 于 输入 ， 再 用 BP 算法 对 权 值 进行 微调 ( 见 图 6-6 右边 )。 


大 数据 与 深度 学 习 


在 工业 界 一 直 有 个 很 流行 的 观点 : 在 大 数据 条 件 下 ， 简 单 的 机 带 学 习 模型 会 比 复 
杂 模 型 更 加 有 效 。 例 如 ， 在 很 多 大 数据 应 用 中 ， 最 简单 的 线性 模型 得 到 了 大 量 使 用 。 
而 最 近 深 度 学 习 的 惊人 进展 ,促使 我 们 开始 重新 思考 这 个 观点 。 人 简 而 言 之 ， 在 大 数据 
情况 下 ， 也许 只 有 比较 复杂 的 模型 ,或 者 说 表达 能 力 强 的 模型 ， 才 能 充分 发 据 海 量 效 
据 中 纺 藏 的 丰富 信息 。 运 用 更 强大 的 深度 模型 ,也许 能 从 大 数据 中 发 掘 出 更 多 有 价值 
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的 信息 和 知识 。 


为 了 理解 为 什么 大 数据 需要 深度 模型 ， 下 面 我 们 举 一 个 例子 。 语 首 识别 已 经 是 一 
个 大 数据 的 机 各 学 习 问 题 , 在 其 声学 建 模 部 分 ， 通常 面临 的 是 十 亿 到 千 亿 级 别 的 训练 
样本 。 在 谷歌 的 一 个 语音 识别 实验 中 ， 人 们 发 现 训练 后 的 DNN 对 训练 样本 和 测试 样 
本 的 预测 误差 基本 相当 。 这 是 违反 第 识 的 ， 因 为 模型 在 训练 样本 上 的 预测 误差 通 第 会 
显 阁 小 于 测试 样本 。 因 此 ， 只 有 一 种 解释 ， 就 是 由 于 大 数据 里 含有 丰富 的 信息 维度 ， 
即便 是 DNN 这 样 的 蜗 容 量 复杂 模型 也 处 于 欠 拟 合 的 状态 ， 更 不 必 说 传统 的 GMM 声 
学 模型 了 。 所 以 从 这 个 例子 中 可 以 看 出 ， 大 数据 需要 座 度 学 习 。 

与 人 工 规则 构造 特征 相 比 ， 利 用 大 数据 来 学 习 特征 ,更 能 刻画 数据 丰 宦 的 内 在 信 
上 县。 所 以 ,在 未 来 的 儿 年 里 ， 我 们 将 看 到 越 来 越 多 的 例子 : 深度 模型 应 用 于 大 数据 ， 
而 不 是 浅 层 的 线性 模型 。 


典型 应 用 : 教会 计算 机 听 、 看 、 说 


根据 上 市 的 内 容 , 我 们 发 现 深 上 度 学 习 的 基本 原理 并 无 特别 神秘 之 处 , 它 之 所 以 得 到 
工业 界 和 学 术 界 的 广泛 关注 ， 是 因为 自 2011 年 以 来 ， 深度 学 习 在 多 个 应 用 领域 取得 了 
令 人 有 鼎 目 的 成 有 末 。 本 将 介绍 这 度 学 习 最 典型 的 三 个 应 用 : 语 首 识别 、 图 像 识别 和 目 
然 语 言 处 理 。 


语音 识别 


语音 识别 是 深度 学 习 最 早 取得 突破 性 成 末 的 一 个 领域 。 长 期 以 来 语音 识别 系统 ， 
在 声学 建 模 (一段 波形 向 一 个 音 双 的 映 冉 ) 部 分 大 多 采用 的 是 混合 高 斯 模型 (GMM )。 
这 种 模型 由 于 佑 计 人 简单 ， 适 合 海量 数据 训练 ， 同 时 有 成 束 的 区 分 度 训 练 技术 文 持 ， 一 
直 在 语音 识别 应 用 中 占有 垄断 性 地 位 。 但 这 种 混合 高 斯 模型 本 质 上 是 一 种 浅 层 网 络 建 
模 ， 不 能 充分 描述 特征 的 状态 空间 分 布 。 而且 ,GMM 建 模 的 特征 维 数 一 般 是 几 十 维 ， 
不 能 充分 描述 特征 之 间 的 相关 性 。 另 外 ，GMM 建 模 本 质 上 是 一 种 似 然 概率 建 模 ， 虽 
然 区 分 度 训练 能 够 模拟 一 些 模式 类 之 加 的 区 分 性 ， 但 能 力 有 限 。 

微软 研究 院 语 音 识别 专家 邓 立 和 俞 栋 从 2009 年 开始 和 辛 顿 合作 。 他 们 建立 了 一 
些 巨大 的 神经 网 络 ， 其 中 一 个 包含 了 6600 多 万 神经 连结 ( 如 图 6-7 所 示 )， 这 是 语音 
识别 研究 史上 最 大 的 同类 模型 。 在 这 套 系 统 中 ，DNN 的 第 一 层 隐 层 广 操 用 于 接收 输 
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入 , 接 下 来 的 不 同 层级 能 够 识别 语音 频谱 中 的 特定 模式 , 而 整个 系统 中 包含 7 级 隧 层 ， 
并 用 RBM 逐 层 预 训 练 。 为 什么 是 7 层 呢 ? 因为 在 实践 中 , 这 个 数量 的 隐 层 效果 最 好 。 


隐 马 尔 可 夫 链 
~ 一 观测 概率 
Wy 
see 深度 神经 网 络 
W, 
村 
1 
= 和 中 | 如 Zrii 各 Ww 观测 


图 6-7 语音 识别 流水 线 中 的 深度 神经 网 络 (图 片 来 自 文献 “) 


采用 深度 神经 网 络 可 以 充分 描述 特征 之 间 的 相关 性 , 可 以 把 连续 多 帆 的 语 首 特征 
并 在 一 起 ， 构 成 一 个 高 维特 征 。 最 终 的 深度 神经 网 络 可 以 采用 高 维特 征 训练 来 模拟 。 
另外 ， 它 拥有 更 为 稳定 的 表述 (Invariant Representation ) 特性 ， 层 级 越 多 ， 抽 象 能 
越 强 。 举 例 来 说 ， 尺 管 男女 声 首 频 谱 差 别 很 大 ， 但 对 DNN 来 说 ， 几 乎 没有 分 别 ， 而 
GMM 模 型 受 其 影响 颇 大 ;再 比如 针对 特定 个 人 训练 的 GMM 模 型 ,效率 能 够 提升 10%， 
而 DNN 则 几乎 不 变 ; 在 Aurora 语音 数据 库 的 噪音 测试 中 ， 通 过 多 种 方式 优化 后 的 
GMM 模型 所 达到 的 效果，DNN 很 容易 就 能 实现 。DNN 模型 在 Switchboard 标准 数据 
集 的 识别 错误 率 比 以 前 的 最 低 错 误 率 降低 了 33%。 在 语音 识别 领域 , 这 个 数据 集 上 最 
低 的 错误 率 已 经 多 年 没有 更 新 了 。 这 是 自 HMM 出 现 30 多 年 以 来 ， 单 项 技术 使 语音 
识别 精确 度 获得 的 最 大 提升 。 
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让 人 有 些 意 外 的 是 ，DNNN 不 但 大 幅度 提高 了 准确 座 ， 还 间接 解决 了 语 首 识别 模 
型 训练 的 一 个 实际 问题 : 对 于 一 些小 语种 ， 无 法 收集 到 足够 多 的 训练 语 料 数 据 。 合 歌 
的 研究 人 员 发 现 了 一 个 有 趣 的 现象 ， 先 针对 有 足够 训练 数据 的 大 语种 ( 如 器 语 ) 训练 
一 个 识别 网 络 ， 然 后 将 网 络 最 顶层 的 英语 音 系 分 类 层 去 邱 ， 代 之 以 东 个 新 语言 的 音 系 
分 类 屋 ， 而 重用 下 层 产 生 的 特征 ( 即 把 原 网 络 去 挥 最 项 层 后 当成 一 个 语音 特征 提取 
全 )， 这 样 只 要 人 花 非 笛 少 的 训练 代价 ， 就 可 以 得 到 一 个 效果 非常 好 的 新 语言 识别 网 络 。 
特征 重用 市 来 的 迁移 学 习 能 力 体 现 了 表示 学 习 的 巨大 威力 。 


任务 A 任务 B 任务 C 


输出 


至 的 特征 


0 


订 


输入 


6-8 ”表示 学 习 和 多 任务 学 习 


图 像 识 别 


深度 学 习 用 于 疼 像 识别 最 多 广为人知 的 是 “谷歌 大 脑 ” 项 目 。 这 套 系 统 可 以 通过 
在 YouTube 上 浏览 图 像 从 而 自学 如 何 识 别 猫 等 对 象 。 开发 这 个 系统 的 实验 室 原 隶属 
于 GoogleX， 他 们 最 广为人知 的 作品 有 Google Glass 以 及 自动 驾驶 汽车 。 谷 歌 研 究 人 
员 搭 建 了 一 个 巨大 的 深度 网 络 ( 见 图 6-9 )， 该 网 络 由 三 层 改 进 的 稀 芒 上 自 编 码 需 组 成 ， 
共有 10 亿 个 参数 要 学 习 ， 堪 称 史 上 最 大 的 神经 网 络 。 


谷歌 把 从 YouTube 随机 挑选 的 1000 万 张 200 x 200 像素 的 缩 略图 输入 到 该 系统 ， 
让 计算 机 寻找 图 像 中 一 再 重复 出 现 的 特征 ， 从 而 对 含有 这 种 特征 的 物体 进行 识别 。 他 
们 用 了 1000 台 机 器 共 16 000 个 核 训练 了 1 周 。 最 后 ， 在 网 络 中 出 现 了 能 够 识别 猫 脸 
和 人 脸 的 神经 元 。 换 名 话说,“ 大 脑 ” 终 于 认识 了 什么 是 猫 ， 并 从 接 下 来 输入 的 2 万 
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张 图 片 中 准确 地 找 出 了 猫 的 照片。 


人 


输入 到 上 面 的 其 他 层 
(8 个 通道 的 图 像 ) 


输出 通道 的 数量 =8 


a a 全 
WA 
De 


” 图片 尺寸 =200 
图 6-9 ”谷歌 大 脑 神经 网 络 (图 片 来 自 文献 中 ) 


以 往 传统 的 面部 识别 技术 , 一 般 虱 是 由 人 研究 者 和 完 在 计算 机 中 通过 定义 识别 对 象 的 
形状 边缘 等 信息 “教会 ”计算 机 该 对 象 的 外 观 ， 然 后 计算 机 对 包含 同类 信息 的 图 片 作 
出 标识 ， 从 而 达到 “识别 ”的 效果 。 然 而 ， 在 谷歌 这 个 神经 网 络 里 ， 人 们 从 未 向 计算 
机 描述 哎 星 人 长 啥 样 ， 计 算 机 基本 上 徘 目 己 产 生 了 “ 噶 星 人 ”这 一 概念 。 机 釉 有 史 以 
来 首次 对 于 猫 脸 或 人 体 这 种 “高 级 概念 ”有 了 认 知 。 


实际 上 图 像 是 深度 学 习 最 早 尝 试 的 应 用 领域 。 早 在 1989 年 ， 严 恩 ， 乐 库 和 他 的 
同事 们 就 发 表 了 卷 积 神经 网 络 ( Convolution Neural Networks，CNN ) 的 工作 。CNN 
是 一 种 市 有 卷 积 结构 的 次 度 神 经 网 络 ， 通 稼 至 少 有 两 个 非 线性 可 训练 的 卷 积 层 、 两 个 
非 线 性 的 固定 卷 积 层 ( 又 叫 Pooling Layer ) 和 一 个 全 连接 层 ， 一 共 至 少 $ 个 隐 含 层 。 
CNN 的 结构 受到 著名 的 Hubel-Wiesel 生物 视 党 模型 的 启发， 尤其 是 模拟 视觉 皮层 V1 
和 V2 层 中 Simple Cell 和 Complex Cell 的 行为 。 

在 很 长 一 段 时 间 里 ，CNN 虽然 在 小 规模 的 问题 上 (如 手写 数字 ) 取得 过 当时 世 
界 最 好 的 结果 ， 但 一 下 没有 取得 巨大 的 成 功 。 主 要 原因 是 CNN 在 大 规模 图 像 上 效果 
不 好 ， 所 以 没有 得 到 计算 机 视觉 领域 的 足够 重视 。 这 种 情况 一 直 持 续 到 2012 年 ， 尝 
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顿 与 其 学 生 为 了 回应 别人 对 于 深度 学 习 的 质疑 ， 而 将 深度 学 习 用 于 ImageNet (图 像 
识别 目前 最 大 的 数据 库 ) 上 ， 最终 取得 了 非常 惊人 的 成 绩 ,， 将 前 5 选 错 误 率 由 25% 降 
低 为 17%。 


ImageNet 目 前 共 包 含 大 约 22 000 类 、15 浪 张 的 标定 图 像 ,其 中 ,最 常用 的 LSVRC-2010 
比赛 包含 1000 类 、1.2 兆 张 图 像 。 辛 顿 的 学 生 采 用 了 一 个 非常 “大 而 深 ” 的 CNN 模型， 
图 6-10 给 出 了 整个 网 络 结构 ， 共 包含 8 层 , 其 中 前 5 层 是 CNN, 后 面 3 层 是 全 连接 的 网 
络 , 最 后 一 层 是 softmax 组 成 的 输出 决策 层 (输出 厄 点 数 等 于 类 别 数 目 1000 )。 在 辛 顿 的 
模型 里 ， 输 入 就 是 图 像 的 像素 ， 没 有 用 到 任何 人 工 特征 。 


192 1 守 交 
贱 冯 天 pooaling 


也 日 当下 而 站 二 闪 


LE 


6-10 ImageNet 图 片 识别 使 用 的 卷 积 神经 网 络 (图 片 来 自 文献 站) 

该 模型 在 传统 CNN 的 基础 上 引入 了 一 些 改进 ， 包 括 : 

口 采用 ReLU 来 代 答 传统 的 tanh 引入 非 线性 ; 

口 采用 两 块 显卡 来 进行 并 行 计算 ; 

口 同 层 相 邻 节点 的 啊 应 进行 局 部 归 一 化 提高 了 识别 率 ; 

口 有 交 芋 的 下 采样 (pooling )。 

此 外 ， 为 了 降低 过 拟 合 ， 采 用 了 以 下 两 种 方式 : 

口 数据 加 强 ， 对 训练 数据 进行 左右 对 称 以 及 平移 变换 , 将 训练 数据 增加 为 原来 的 

2048 倍 ; 

口 dropout， 一 种 非常 简单 有 效 的 前 人 馈 神 经 网 络 正 则 化 技术 。 

这 个 惊人 的 结果 为 什么 在 之 前 没有 发 生 ? 原因 当然 包括 算法 的 提升 ,但 最 重要 的 
是 ，GPU 种 来 的 计算 能 力 的 提升 和 更 多 的 训练 数据 。 

比 在 ImageNet 上 识别 率 大 幅度 提高 更 重要 的 是 ， 人 们 发 现 ， 把 这 个 网 络 的 最 后 
分 类 层 去 掉 后 作为 特征 提取 和 需 ， 直 接应 用 到 其 他 数据 集 ( 如 PascalVOC ) 和 分 类 以 外 
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的 其 他 视觉 任务 ( 如 检测 、 细 粒度 识别 等 )， 基 本 都 提高 了 现 有 的 最 好 结 末 ， 并 且 在 
很 多 情况 下 提高 幅度 还 非常 大 。 与 请 音 识 别 一 样 ， 表 示 学 习 再 一 次 展示 了 它 强 大 的 泛 
化 能 力 。 可 以 说 ， 基 于 CNN 的 特征 提取 ， 正 在 代 构 计算 机 视觉 领域 10 多 年 来 积 素 的 
各 种 特殊 模型 和 技巧 ， 成 为 该 领域 事实 上 的 标准 预 处 理 方 法 。 


目 然 语言 处 理 


总 的 来 说 ， 深 度 学 习 在 自然 语言 处 理 (NLP ) 上 取得 的 进展 没有 在 语音 图 像 上 那 
么 和 夺目。 一 个 很 有 意思 的 现象 是 : 相 比 于 声音 和 疼 像 等 砍 层 原始 信号 ， 语 言 是 一 种 非 
目 然 信号 ， 是 完全 由 人 类 大 脑 产 生 和 处理 的 符号 系统 ， 属 于 人 类 认 知 过 程 中 产生 的 融 
层 认 知 抽象 实体 。 现 有 人 工 神 经 网 络 染 构 似 乎 在 处 理 日 然 语言 上 没有 显现 明显 的 优 
扬 。 然 而 ， 随 着 语 首 识别 和 图 像 识别 中 的 难题 被 攻破 ，NLP 成 为 深度 学 习 人 研究 的 前 沿 
阵地 ,很 多 人 研究 成 末 已 经 抱 开 了 局 深 名 测 的 人 类 语言 的 神秘 面纱 ,让 人 们 看 到 了 表示 
学 习 的 思想 在 高 级 认 知 领域 的 巨大 洪 力 。 


目前 深度 学 习 在 NLP 领域 的 研究 中 ， 最 有 趣 也 是 最 基本 的 就 是 “ 词 辣 量 ”J 了 。 
因此 本 市 重点 介绍 词 同 量 模型 及 其 应 用 。 日 然 语言 理解 的 问题 要 转化 为 机 占 学 习 的 问 
如 ， 第 一 步 肯 定 是 要 找 一 种 方法 把 这 些 符号 数学 化 。NLP 中 最 耳 观 也 是 到 目前 为 止 最 
常用 的 词 表 示 方 法 是 One-hot 稀 瑰 表示 ， 这 种 方法 把 每 个 词 表 示 为 一 个 很 长 的 丫 量 。 
这 个 回 量 的 维度 是 词 表 大 小 ， 其 中 绝 大 多 数 元 系 为 0， 只 有 一 个 维度 的 值 为 1， 这 个 
维度 就 代表 了 当前 的 词 。 例 如 : 


“ 话 简 ” 表 示 为 [0001000000000000.…] 
“麦克 ”表示 为 [0000000010000000...] 


每 个 词 都 是 茫茫 0 海中 的 一 个 1。 

这 种 简洁 的 表示 方法 配合 最 大 焙 、SVM 、CREF 等 算法 已 经 很 好 地 完成 了 NLP 领 
域 的 各 种 主流 任务 。 但 是 这 种 表示 方法 也 存在 一 个 重要 的 问题 ， 这 就 是 “词汇 鸿沟 ” 
现象 : 任意 两 个 词 之 间 都 是 拆 立 的 。 光 从 两 个 向 量 中 看 不 出 两 个 词 是 否 有 关系 ， 哪 怕 
是 “ 话 简 ”和 “麦克 ”这 样 的 同义词 也 不 能 洱 免 于 难 。 

如 果 用 这 种 稀 玖 表示 法 表示 词 ， 在 解决 某 些 任务 的 时 候 ( 比如 构建 语言 模型 ) 会 
造成 维 数 灾难 ,使 用 低 维 的 词 向 量 就 没有 这 样 的 问题 。 同 时 ,高 维 的 特征 如 果 要 套用 
深度 学 习 ， 其 复杂 度 几 乎 是 难以 接受 的 ， 因 此 深度 学 习 中 一 般 用 到 的 词 向 量 并 不 是 用 
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刚才 提 到 的 One-hot 表示 ， 而 是 用 分 布 式 表示 ( distributed representation ) 的 一 种 低 维 
实数 向 量 , 通常 被 称 为 词 向 量 ( word embedding )。 这 种 向 量 一 般 长 成 这 个 样子 : [0.792， 
-0.177, -0.107, 0.109, -0.542, ...]。 维 度 以 50 维和 100 维 比较 常见 。 分 布 式 表示 最 大 的 
好 处 就 是 让 相关 或 者 相似 的 词 在 距离 上 更 接近 。 回 量 的 距离 可 以 用 最 传统 的 欧 氏 距离 
来 衡量 。 用 这 种 方式 表示 的 回 量 ,“ 麦 元 ”和 “ 话 简 ”的 距离 会 远 远 小 于 “ 麦 殉 ”和 
“大 

词 回 量 怎么 得 到 呢 ? 一 般 是 在 训练 语言 模型 的 同时 ,“ 顺 便 ” 得 到 词 回 量 。 因 此 
我 们 先 来 介绍 语言 模型 。 语言 模型 其 实 就 是 看 一 句 话 是 不 是 正常 人 说 出 来 的 。 在 NLP 
的 很 多 任务 中 都 能 用 到 ， 比 如 机 需 翻 译 、 语 音 识 别 得 到 香干 候选 之 后 ， 可 以 利用 语言 
模型 挑 一 个 尽量 靠 谱 的 结果 。 


语言 模型 形式 化 的 描述 就 是 给 定 一 个 字符 串 ， 看 它 是 自然 语言 的 概率 
PWwiw2…Wi)。w1 到 wi 依次 表示 这 句 话 中 的 各 个 词 。 笛 用 的 语言 模型 都 是 在 近似 地 
求 Powlwby wwrD。 比 如 n-gram 模型 就 是 用 POwiwiwii…,wi) 近似 表示 前 者 。 声 
言 模 型 的 最 经 典 之 作 要 数 深 度 学 习 的 主要 页 献 者 之 一 Bengio 在 2001 年 发 表 在 NIPS 
上 的 文 草 “A Neural Probabilistic Language Model”。 他 用 了 一 个 三 层 的 神经 网 络 来 构 
建 语言 模型 ， 同 样 也 是 n-gram 模型 ， 如 图 6-11 所 示 。 


第 i 层 的 输出 =P(w=i| 上 下 文 ) 


\ softmax 
™ 


Ma 大 多 数 计算 在 这 里 、、 


CC EE 


在 C 中 查 表 在 单词 之 间 共 享 的 参数 


一 AP+1 的 索引 一 2 的 索引 w 一 1 的 索引 
图 6-11 Bengio 的 神经 网 络 语言 模型 (图 片 来 自 文献 中) 
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它 的 基本 思想 是 : 假设 我 们 已 经 知道 每 个 词 的 向 量 表示 ， 现 在 用 前 n-1 个 词 
的 向 量 表示 作为 一 个 单 隐 层 神 经 网 络 的 输入 ， 去 预测 第 n 个 词 。 当 以 最 大 似 然 为 
优化 目标 用 随机 梯度 法 训练 好 这 个 网 络 后 , 同时 我 们 也 得 到 一 份 训练 好 的 词 问 量 。 


用 深度 学 习 的 表示 和 学习 思 想 产 生词 问 量 的 男 一 个 代表 性 工作 是 word2vec。word2vec 
是 谷歌 在 2013 年 年 中 开源 的 一 球 将 词 表 征 为 实数 值 和 呵 量 的 高 效 工 具 。 有 了 人 词 的 问 量 表 
示 可 以 干 很 多 事情 , 例如 给 定 一 个 词 , 找 和 它 意 思 最 相近 的 词 ( 就 是 在 问 量 空间 中 和 这 
个 词 对 应 的 点 距离 最 近 的 那些 点 )。 


word2vec 的 基本 思想 是 用 一 个 词 在 文本 中 出 现时 的 上 下 文 来 表征 这 个 词 的 语义 ， 
进而 计算 它 的 向 量 表 示 。 套 用 社会 学 的 话 来 说 ， 个 体 是 由 其 所 处 的 社会 关系 定义 的 ， 
近 朱 者 汞 ， 近 墨 者 黑 。 如 采 两 个 词 经 尝 在 相同 的 语 境 中 出 现 ,那么 它们 很 可 能 有 相同 
或 相似 的 语义 。 例如 school 和 university，lake 和 river。 我 们 在 训练 时 ， 就 想 办 法 让 这 
两 个 词 的 癌 量 表示 在 回 量 空间 中 不 断 拉 近 。 上 文 介 绍 的 Bengio 的 神经 网 络 语 言 模 型 ， 
也 是 这 种 思想 。 


word2vec 用 了 两 个 模型 : Continuous Bag-OfWords ( CBOW ) 和 Continuous 
Skip-gram， 如 图 6-12 所 示 。 和 神经 网 络 语言 模型 一 样 ， 都 是 通过 预测 来 体现 一 个 词 和 
它 上 下 文 的 关系 。CBOW 是 通过 上 下 文 来 预测 中 间 的 词 ，Skip-gram 模型 与 CBOW 正好 
相反 , 是 通过 中 间 词 来 预测 前 后 词 , 一 般 可 以 认为 位 置 距 离 接近 的 词 之 间 的 联系 要 比 位 
置 距离 较 远 的 词 的 联系 有 紧密。 


输入 映射 输出 输入 映射 输出 


w(t-2) A wt2) 


De 


w(t-1) 


w(t) 


w(t+1) A 


w(t+2) | < w(t+2) 


w(t+1) 


CBOW Skip-gram 


6-12 ”word2vec 的 CBOW 和 Skip-gram 模型 (图片 来 自 文献 9) 
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word2vec 有 一 个 非常 有 趣 的 特性 , 不 仅 词 向 量 可 以 反映 词 本 身 的 语义 ， 有些 情况 
下 ， 两 个 词 回 量 的 线性 运算 ( 回 量 差 ) 还 可 以 反映 两 个 词 的 某 种 语义 关系 。 例 如 : 


vector('Paris') — vector('France') + vector('Italy') 二 (了 ome )， 

vector('king') ~ vector('man') + vector(‘woman') 一 vector('queen') 

我 们 在 训练 时 并 没有 告诉 模型 任何 关于 国家 和 前 都 之 类 的 知识 ,图 6-13 中 的 关系 
完全 是 通过 海量 语料库 训练 后 日 发 涌现 出 来 的 。 


通过 PCA 方 法 计算 出 来 的 国家 及 其 首都 的 向 量 


_15 1 二 0 0.5 1 15 2 


6-13 ”word2vec 国家 和 首都 词汇 词 向 量 投 影 《图 片 来 自 文献 ”1) 


word2vec 还 有 一 个 有 趣 的 应 用 ， 托 蕊 斯 . 米 克 罗 夫 (Tomas Mikolov ) 和 他 在 谷 
歌 的 同事 开发 出 了 一 种 技术 ,能 上 自动 创建 用 于 机 器 翻译 的 词典 ， 即 能 将 一 种 语言 转换 
成 另 一 种 霹 言 的 词汇 对 照 表 。 这 种 新 技术 不 是 依赖 同一 份 文 档 不 同 霹 言 的 版 本 ， 而 是 
利用 数据 挫 掘 技术 制作 一 种 语言 结构 的 模型 ， 然 后 再 跟 另 一 种 语言 结构 进行 对 比 。 它 
依靠 的 理念 是 每 种 语言 都 会 描述 一 些 类 似 的 观点 , 所 以 执行 这 些 描述 动作 的 词语 一 定 
有 很 多 相似 之 处 。 例 如 , 大 部 分 二 言 都 有 摘 述 尝 见 动物 (如 猫 、 狗 、 奶 牛 等 ) 的 词语 。 
也 许 ， 在 诸如 “ 猫 是 一 种 比 狗 小 的 动物 ”这 样 的 句子 中 ， 那 些 描述 动物 的 词语 的 使 用 
方法 是 相同 的 。 
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例如 英语 和 西班牙 霹 两 种 语言 ,通过 训练 分 别 得 到 它们 对 应 的 词 癌 量 空间 E 和 $。 
从 英语 中 取出 5 个 词 one, two, three, four, five, 设 其 在 E 中 对 应 的 词 癌 量 分 别 为 v1， 
v2，v3，v4，v5， 为 方便 作 图 ， 利 用 主 成 分 分 析 ( PCA ) 降 维 ， 得 到 相应 的 二 维 癌 量 
ul，u2，u3，u4，u5， 在 二 维 平面 上 将 这 5 个 点 描 出 来 ， 如 图 6-15a 所 示 。 类 似 地 ， 
在 西班牙 语 中 取出 (与 one，two，three，four，five 对 应 的 ) uno，dos，tres，cuatro， 
cinco， 设 其 在 S 中 对 应 的 词 癌 量 分 别 为 81，s2，s3，s4，s$， 用 PCA 降 维 后 的 二 维 问 
量 分 别 为 t，2,， 6 ,，f,， 二， 将 它们 在 二 维 平面 上 描 出 来 (可 能 还 需 作 适当 的 旋转 )， 
如 图 6-15b 所 示 。 
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6-15 ”word2vec 训练 得 到 的 英语 和 西班牙 语 的 词 向 量 空间 (图 片 来 自 文献 “) 


观察 这 两 幅 图 ， 容 易 发 现 :5 个 词 在 两 个 回 量 空间 中 的 相对 位 置 差不多 ， 这 说 明 
两 种 不 同 语言 对 应 癌 量 空间 的 结构 之 间 有 具有 相似 性 ， 从 而 进一步 说 明了 在 词 呵 量 空间 
中 利用 距离 刻画 词 之 间 相 似 性 的 合理 性 。 

不 同 请 言 在 这 个 回 量 空间 中 有 很 多 相似 之 处 。 这 意味 春 两 种 寺 言 的 转换 过 程 关 似 
于 两 个 回 量 空间 的 转换 过 程 。 这 就 把 翻 详 从 寺 言 问题 转 成 了 数学 问题 ， 即 寻找 将 一 个 
回 量 空间 映射 到 邦 一 个 回 量 空间 的 线性 变换 。 为 此 ， 可 以 采用 由 专业 人 士 编辑 的 小 型 
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双语 词典 ， 通 过 对 比 两 种 语言 的 对 应 词语 语 料 集 来 求 得 这 个 线性 变换 。 接 下 来 就 答 单 
了 ， 把 变换 运用 到 更 大 的 声言 空间 中 ， 即 可 得 到 任何 一 个 词 的 对 应 词 。 尽 管 Tomas 
Mikolov 方法 很 答 单 ， 但 是 非常 有 效 ， 英 声 和 西班牙 语 之 间 词 语 翻译 的 准确 率 能 接近 
90%。 这 种 方法 可 以 用 来 拓展 和 提炼 现 有 词典 ， 甚 至 可 以 查找 这 些 词典 中 的 错误 。 而 
日 谷歌 这 个 团队 的 确 在 一 个 瑞 语 - 捷 元 语词 典 中 发 现 了 大 量 错误 。 

值得 注意 的 是 , word2vec 通过 一 个 词 和 它 周 围 词 的 关系 把 词 这 种 离散 符号 问 量 化 ， 
并 在 回 量 表示 中 体现 符号 的 语义 ， 这 种 思想 的 应 用 并 不 限于 自然 语言 这 种 符号 序列 。 
只 要 在 某 种 特定 结构 (序列 、 树 、 网 络 等 ) 里 绪 点 和 周 于 的 结 点 形成 某 种 关系 ， 都 可 
以 把 结 点 看 成 目 然 语言 中 的 “词汇 ”符号 ， 用 类 似 的 方法 处 理 。 事 实 上 , 已 经 有 学 者 
把 word2vec 的 词 通 入 方法 用 于 社交 网 络 的 分 析 ， 取 得 了 很 好 的 效 末 ， 相 关 人 研 究 已 发 表 
在 2014 年 的 ACM SIGKDD 国际 会 议 上 。 


深度 学 习 为 什么 这 么 火 ” 介绍 完 它 的 原理 和 典型 应 用 之 后 ,我们 这 里 做 一 个 “ 另 
类 的 ”生态 学 的 类 比 。 如 果 把 深度 学 习 比 作 一 个 物种 ， 和 其 他 机 顺 学 习 物 种 相 比 ， 它 
有 两 个 特点 : () 不 挑食 。 无 论 原始 数据 属于 网 像 识 别 、 语 言 识 别 、NLP、 生 物 医药 等 
哪个 领域 ， 都 可 以 “ 咀 ” 给 神经 网 络 学 习 处 理 。 这 和 大 脑 的 工作 原理 很 相似 ， 大 脑 用 
同一 套 算法 解决 视觉 、 上 听觉、 嗅觉 等 感知 问题 。(2) 胃口 大 。 咀 给 它 的 数据 越 多 ， 它 
就 变 得 能 力 越 强 ， 越 聪明 ， 并 且 只 会 吃 不 饱 ， 不 会 消化 不 良 。 

正 是 因为 这 两 个 特点 , 这 个 物种 在 20 世纪 BP 算法 发 明 的 80 年 代 和 SVM 风靡 的 
90 年 代 ， 都 没有 合适 的 生长 环境 。 只 有 到 了 今天 ， 有 了 充足 的 食物 供应 (大 数据 )， 
并 进化 出 了 极 强 劲 的 消化 系统 (GPU 、 云 计算 )， 深 度 学 习 怪 兽 终于 迎 来 了 崛起 的 契 
机 ， 并 逐渐 淘汰 其 他 物种 ( 浅 层 学 习 算 法 )， 称 霸 地 球 。 

深度 学 习 目 前 虽然 在 语音 识别 、 图 像 识别 等 很 多 领域 都 取得 了 令 人 瞩目 的 成 果 ， 
但 无 论 在 理论 上 还 是 应 用 上 都 还 有 巨大 的 探索 空间 。 


在 应 用 方面 


相 比 于 语音 和 静态 图 像 , 视频 和 自然 语言 理解 以 及 多 模 态 信 息 的 整合 仍 有 很 多 理 
论 和 工程 问题 亟待 解决 ， 是 深度 学 习 研 究 者 们 正在 集中 火力 攻克 的 前 沿 阵地 。 


深度 学 习 在 图 像 识别 、 博 音 识别 和 目 然 语 言 处 理 这 些 领 域 的 能 力 已 经 接近 或 达到 


154 ， 科 学 的 极致 : 漫谈 人 工 智能 


人 类 的 水 平 ， 使 机 融 像 我 们 人 一 样 能 “看 ”， 能 “ 听 ”， 能 “说 "。 除 此 以 外 ， 我 们 更 
希望 深度 学 习 在 普通 人 类 不 擅长 的 信息 处 理 领域 大 显 神 威 , 小 到 天 气 预 测 、 股 票 预 测 ， 
大 到 历史 和 社会 的 发 展 态势 分 析 和 预测 ， 其 至 科学 知识 的 发 现 ( 例如 用 深度 学 习 方 法 
发 现 新 的 数学 或 物理 定律 )。 我 认为 在 这 些 领 域 获得 突破 的 音义 更 大 ， 因 为 人 工 入 能 
的 终极 目标 不 是 模仿 人 类 ， 而 是 超越 人 类 。 

在 理论 方面 

这 度 学 习 虽 然 通过 目 动 学 习 特 征 表 示 将 人 从 手工 特征 说 计 中 解放 了 出 来 , 向 前 迈 
进 了 一 大 步 , 但 目前 在 神经 网 络 染 构 中 ， 网 络 层 数 、 每 层 神 经 元 的 种 类 和 个 数 、 训 练 
算法 参数 等 超 参 数 可 能 对 最 后 结果 有 非常 大 的 影响 。 这 些 超 参数 的 设置 和 调节 ， 仍 然 
高 度 依赖 人 的 经 验 。 目 动 网 络 结构 学 习 和 超 参 数 调节 是 深度 学 习 摆 脱 依靠 经 验 的 “中 
医 "“ 烁 金 术 ”状态 ,走向 依 徘 理论 的 “西医 “科学 ”的 必由之路 。 


这 度 学 习 从 原始 目 然 信号 中 提取 特征 完成 任务 的 过 程 是 个 “器 盒子 ”， 缺 乏 可 解 
释 性 ,类似 于 哺乳 动物 的 低级 认 知 功能 。 与 之 相对 , 基于 抽象 符号 和 规则 的 逻辑 推理 作 
为 人 工 智能 的 早期 方法 , 虽然 能 部 分 模拟 人 的 高 级 认 知 功能 , 却 和 现 有 的 神经 网 络 框架 
“水 火 不 容 ”。 如何 把 深度 学 习 过 程 和 人 类 已 经 积累 的 大 量 高 度 结构 化 知识 融合 , 发 展 出 
逻辑 推理 甚至 目 我 意识 等 人 类 的 高 级 认 知 功能 ， 是 下 一 代 闪 度 学 习 的 核心 理论 问题 。 


深度 学 习作 为 一 种 非常 成 功 的 仿生 算法 ， 怎样 和 其 他 仿生 和 上 自然 计算 理论 框架 ， 
如 强化 学 习 (如 Q-learning )、 演 化 计算 ( 如 遗传 算法 )、 群 体 智 能 ( 如 蚁 群 算法 )、 主 
动 学 习 ( active learning )、 毕 生 学 习 ( lifelong learning ) 有 机 结合 ， 发 挥 更 大 的 潜力 ， 
也 是 非常 有 趣 的 诛 题 。 

路 漫漫 其 修 远 分 ，, 吾 将 上 下 而 求索 。 尽 管 有 各 种 不 足 ， 深 度 学 习 仍 是 现 阶 段 实现 
人 工 智 能 的 最 靠 谱 的 途径 。 如 果 我 们 能 在 上 述 理论 、 建 模 和 工程 方面 突破 深度 学 习 面 
临 的 一 系列 难题 ，AI 之 梦 将 不 再 遥远 。 
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第 7 瘟 ” 关 于 人 工 智能 与 人 脑 智能 的 
思考 : 康 讲 二 和 贝 请 士 的 对 话 


王 长 明 


本 草 将 通过 两 位 博士 的 对 话 全 面 介绍 人 脑 智能 的 原理 , 对 于 计算 机 爱好 者 了 解 人 
脸 识 别 、 视 党 信 息 加 工 等 热门 话题 那 有 很 好 的 局 发 意义 。 


首先 为 大 家 讲述 一 段 关 于 人 脑 和 计算 机 的 故事 。 


康 博 士 和 由 博士 的 对 话 


康 博 士 是 一 位 计算 机 专家 ,一 直 致 力 于 提高 物体 识别 算法 的 效果 , 开发 了 各 种 特 
征 提取 和 模式 识别 算法 ， 他 的 算法 在 安全 监控 、 无 人 区 驶 、 相 机 、 图 片 搜索 等 领域 发 
挥 了 很 大 作用 。 


贝 博士 是 一 位 脑 科学 专家 ,研究 人 的 面孔 识别 认 知 机 制 , 他 每 天 考虑 的 问题 是 不 
同类 别 物体 加 工 的 机 制 ， 例 如 大 脑 如 何 对 物体 进行 表征 、 表 情 加 工 的 时 间 进 程 、 不 同 
类 别 物体 加 工 的 空间 模式 有 什么 不 同 。 毫 无 疑问 ， 人 类 特有 的 识别 机 制 决定 了 其 鲁 棒 
性 和 准确 率 。 

我 们 知道 ,无论 计 算 机 还 是 人 ， 都 有 很 强 的 物体 识别 能 力 ， 不 过 识别 的 原理 并 不 
相同 。 计 算 机 算法 识别 面孔 主要 是 从 矩阵 表示 的 视觉 信息 中 提取 关键 特征 并 对 其 进行 
分 类 ， 为 了 加 快 识别 速度 ， 特 丈 场合 还 采用 了 数字 信号 处 理 忌 片 。 而 人 的 整套 视觉 系 
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统 ， 从 视网膜 到 视觉 度 层 ， 都 是 利用 海量 神经 元 的 群体 活动 完成 表征 和 识别 的 。 


针对 究竟 谁 的 识别 能 力 更 强 的 问题 ， 两 位 博士 发 生 了 长 时 间 的 争执 ， 最 后 他 
们 决定 设计 一 套 测 试 ， 看 谁 的 识别 更 取 明 。 对 此 ， 贝 博士 显然 更 擅长 ， 每 年 他 痢 
用 各 种 量 表 给 不 计 其 数 的 儿童 测量 智商 ， 评 测 各 种 认 知 能 力 ， 其 中 目 然 包括 物 体 
归 类 、 识 别 和 命名 的 速度 、 准 确 率 等 内 容 。 


第 一 个 题目 : 复杂 场景 中 的 物体 识别 能 力 
题目 取材 于 网 站 常用 的 验证 码 ( 如 图 7-1 所 示 )， 看 谁 的 识别 更 准确 、 更 智 人 


已 
bo 


用 户 账 号 ; 


请 输入 四 位 黑色 验证 码 


倩 输 六 上 图 中 的 里 词 


下 ;六 目 动 登 录 | 豆 记 窗 码 了 
7-1 复杂 验证 码 的 识别 


康 博士 看 到 题目 以 后 恨 得 手心 痒痒 ， 贝 博士 则 瞳 日 盆 襄 ， 心 想 :“ 哥 们 儿 ， 这 题 
可 是 恰恰 来 日 于 你 们 互联 网 啊 。” 

“输入 验证 码 ” 主 要 考察 复杂 场景 中 识别 物体 的 能 力 。 字 母 和 数字 般 入 杂乱 的 场 
景 中 ， 灰 度 也 被 仔细 调整 ， 还 第 第 人 为 加 入 各 种 噪声 ， 让 画面 看 起 来 更 随机 ; 为 了 防 
止 根据 频 域 特征 识别 ， 场 景 中 还 有 线条 等 元 系 ， 虽 然 从 统计 特性 上 看 ， 噪 声 和 目标 字 
从 没有 差别 , 但 是 这 些 元 系 组 合 在 一 起 显然 就 产生 了 质 的 区 别 。 只 是 计算 机 还 没 学 会 
这 种 “组 合 ” 规 则 。 

贝 博士 扫 了 招 康 博士 的 肩膀 ,说 :“ 老 康 ， 现 在 你 们 最 新 的 玩法 似乎 还 加 入 了 阅 
读 理 解 ， 让 人 来 识别 不 同 闫 色 的 字符， 这 分 明 是 在 欺负 现在 的 计算 机 算法 还 不 能 做 这 
种 语义 理解 。 怎 么 样 ， 认 输 吧 ? 哈哈 二 
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贝 博士 这 么 日 信 不 是 没有 原因 的 。 人 人 能够 在 十 分 复杂 的 场景 中 正确 地 分 割 和 识别 
出 物体 ， 这 些 场 景 千变万化 ， 凑 色 、 形 状 、 台 向 各 不 相同 ， 互 相 庶 挡 程 度 很 深 , 甚至 
有 些 物体 的 背景 都 在 运动 , 但 这 些 特 点 丝毫 不 影响 人 们 正确 地 识别 ， 视 党 功 能 正常 的 
人 做 这 类 任务 的 准确 率 几 乎 是 100%， 输 入 验证 人 码 应 用 束 是 人 的 视觉 和 计算 机 视觉 差 
异性 的 具体 体现 。 这 一 技术 目前 被 互联 网 网 站 广泛 应 用 ， 其 有 效 性 不 言 而 喻 。 康 博士 
几乎 没 法 辩解 。 

康 博士 锐 了 皱眉 ， 说 道 :“ 复 杂 场 景 中 不 同 物体 是 如 何 被 识别 出 来 的 是 一 个 十 分 
重要 的 问题 ,虽然 计算 机 和 人 脑 邵 有 物体 识别 能 力 , 但 是 到 目前 为 止 ， 人 的 物体 识别 
能 力 在 准确 率 上 确实 有 不 可 比拟 的 优势 。 


“不 过 ， 这 不 公平 1” 康 博士 思考 了 一 会 儿 继续 说 道 ,“ 这 些 都 依 囊 于 人 强大 的 视 
觉 系统 , 其 结构 和 功能 上 的 优势 特点 经 历 了 亿 万 年 的 进化 , 实际 上 也 是 亿 万 年 “学习” 
的 结果 。” 


贝 博士 说 :“ 你 的 意思 是 ， 如 果 我 给 你 足够 长 的 学 习 时 间 ， 计 算 机 也 能 学 习 出 来 
类 似 的 效果 ?” 


沉思 了 一 下 ， 康 博士 说 :“ 应 该 有 可 能 ! 现在 最 新 的 深度 学 习 技术 实际 上 就 是 代 
鉴 了 神经 网 络 的 工作 原理 ,不 过 和 十 年 前 流行 的 神经 网 络 相 比 ， 如 今 深 度 和 学 习 效 来 这 
么 理想 的 原因 除了 增加 了 网 络 层次 以 外 ， 和 大 样本 不 无 关系 。 而 且 结 构 上 的 特性 也 是 
学 习 出 来 的 , 这 和 人 脑 的 进化 有 看 类 似 的 特点 。 只 是 目前 我 们 还 不 知 违 或 者 无 法 证 明 
这 样 学 习 的 结 来 完 苋 是 不 是 语义 上 的 概念 信息 。” 

第 一 次 过 招 的 结 来 是 人 脑 的 识别 能 力 顾 在 了 当前 , 但 是 能 领先 多 久 取 决 于 计算 机 
算法 对 特征 擎 握 的 程度 ， 而 互联 网 时 代 的 大 数据 无 疑 极 大 地 加 快 了 计算 机 赶 超 的 进 
程 ， 这 也 许 在 暗示 着 不 断 学 习 正 在 帮助 计算 机 变 得 更 加 智能 。 


第 二 个 题目 : 测试 能 够 正确 识别 的 物体 种 类 

图 7-2 表现 的 是 场景 中 有 多 种 颜色 、 形 状 、 位 置 的 视觉 物体 ， 计 算 机 和 人 脑 各 自 
都 能 准确 识别 出 来 吗 ? 

康 博士 看 到 题目 以 后 有 点 得 意 :“ 我 先 来 回答 吧 ， 我 们 最 新 一 代 的 图 片 搜索 引擎 
每 天 都 在 处 理 大量 图 片 信息 , 这 种 算是 小 儿科 了 , 用 户 提交 数 以 万 计 的 物体 , 猫 、 狗 、 
勺子 、 屋 子 、 车 ， 甚 至 很 细微 的 种 类 都 能 够 识别 。” 


5 一 本 证 
图 7-2 复杂 多 类 别 物体 的 识别 

“只 要 有 足够 的 样本 给 我 学 习 ， 那 么 对 于 我 来 说 ， 可 以 学 习 的 类 别 数 量 几 乎 可 以 
无 穷 大 。 这 一 点 你 做 不 到 了 吧 ? ”上 康 博 士 补充 道 。 

“等 等 ! 你 这 里 仅仅 把 物体 定义 为 通过 视觉 方式 获取 的 了 吧 ? 听觉 、 触 党， 其 至 
咒 觉 呢 ?” 数 量 是 多 少 ? ” 贝 博士 问 道 。 

康 博士 迟疑 道 :“ 这 个 …… 这 是 强人 所 难 ， 目 前 搜索 引擎 要 么 基于 文本 信息 ， 要 
么 基于 图 片 ， 视 频 搜 索 尚 在 开发 中 。 理 论 上 ， 触 觉 咒 觉 也 不 是 问题 ， 只 要 你 提供 传 感 
器 信息 。 

贝 博士 笑 着 说 :“ 人 每 天 都 在 处 理 成 千 上 万 的 物体 ， 从 出 门 用 钥匙 锁 门 ， 按 电梯 
按钮 ， 到 中 午 吃 饭 用 盘子 装 午 和 餐 ， 判 断 荣 看 的 种 类 ， 联 想起 食材 ， 到 下 班 路 上 在 川 流 
不 县 的 车 流 中 辨别 目 己 要 乘坐 的 公交 和 车。 从 现 有 数量 上 看 ， 人 类 可 以 识别 目前 几乎 所 
有 现实 存在 的 物体 ， 这 么 说 没 问题 吧 ? ” 

“可 以 这 么 说 吧 。 康 博士 有 点 导 恬 不 平 。 

“ 别 筷 了 人 也 有 很 蝇 的 学 习 能 力 啊 !” 贝 博士 不 无 得 意 。 

“好 吧 ! 在 视 党 方面 至 少 我 们 打 平 了 。” 康 博士 不 想 让 贝 博 士 继续 发 挥 。 

贝 博 士 继续 说 :“ 先 不 讨论 多 个 感知 通路 的 问题 ， 我 的 题目 叫 作 识别 物体 ， 人 胞 
成 这 类 任务 没有 问题 哦 ,在 发 现 之 后 往往 就 能 叫 册 名字， 有些 很 难 命 名 的 ， 人 们 也 可 
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以 尽量 描述 它 的 质地 、 颜 色 、 形 状 、 用 途 等 。 识 别 可 不 仪 仅 是 区 分 开 这 么 简单 哦 1” 


康 博士 只 好 说 :“ 好 吧 , 我 承认 计算 机 处 理 还 没 那 么 智能 ， 目 前 可 以 理解 为 区 分 ， 
至 多 是 归 类 和 再 认 。 

在 识别 的 绝对 数量 这 个 问题 上 ， 由 于 各 种 条 件 的 限制 ， 人 和 计算 机 相 比 全 怕 稍 逊 
一 筹 ,但 是 在 识别 的 智能 化 方面 ， 人 的 优势 就 很 明显 了。 更 重要 的 是 ， 人 的 识别 依 菲 
的 是 多 感官 信息 ， 如 图 7-3 所 示 ， 视 听觉 信息 甚至 触觉 信息 在 识别 和 再 认 方 面 都 起 了 
很 大 作用 , 而 计算 机 目前 的 识别 还 主要 依靠 视觉 信息 , 在 听觉 方面 利用 的 往往 是 语 首 ， 
在 跨 通 路 的 概念 表征 问题 上 还 没有 很 大 的 进步 。 不 过 这 仍然 不 是 永远 的 ， 因 为 我 们 从 
未 要 求 计算 机 进行 这 样 的 “学 习 ”! 相信 在 不 久 的 将 来 ， 计 算 机 应 该 可 以 从 不 同 模 态 
的 数据 中 学 会 类 似 的 概念 。 而 智能 化 的 识别 方面 则 困难 得 多 ,这 涉及 计算 机 算法 识别 
的 基本 模式 ， 甚 至 涉及 计算 机 究竟 应 该 如 何 对 物体 信息 进行 表征 ， 以 利于 后 续 的 加 工 
处 理 ， 相 比 之 下 ， 人 脑 的 信息 加 工 往往 伴随 者 表征 同时 进行 ， 融 为 一 体 。 


DOG 


图 7-3 ”以 视听 觉 方 式 呈 现 的 物体 及 其 概念 信息 


第 三 个 题目 : 运动 物体 的 识别 能 


看 到 这 个 题 日 ， 康 博士 便 着 头皮 说 :“ 目 前 ， 交 通 和 军事 等 特殊 领域 用 得 较 多 ， 
主要 是 对 运动 车 辆 及 导弹 进行 识别 。 这 两 个 问题 差别 很 大 ,一 种 是 摄像 头 日 身 静 止 不 
动 , 一 种 则 不 然 。 目 前 有 很 多 算法 来 跟 踩 场 景 中 的 同一 物体 ， 以 检测 其 运动 轨迹 ， 效 
末 还 不 错 。 差 别 在 于 背景 变 不 变 的 问题 。 

贝 :“ 人 的 视觉 系统 可 以 很 好 地 处 理 这 个 问题 ， 即 便 痛 景 在 变化 ! 这 涉及 视网膜 空 
间 特 殊 表征 ， 即 便 物 体位 置 、 尺 寸 、 朝 向 、 和 角度 发 生 了 很 大 改变 , 仍然 能 够 保持 “视觉 
不 变性 "， 不 会 因为 输入 的 客体 信息 改变 而 影响 识别 输出 结果 ， 这 是 稳定 妃 踪 的 基础 。 
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康 :“ 嘿 ,在 具体 问题 上 ， 机 融 学 习 算 法 ， 特 别 是 深度 学 习 可 以 实现 某 些 特征 的 
不 变性 哦 ， 这 在 技术 上 不 是 难题 。 


贝 :“ 我 就 知道 你 会 这 么 说 。 人 类 视觉 这 种 输入 变化 输出 不 变 的 “视觉 不 变性 
是 人 脑 形成 稳定 的 抽象 概念 的 基础 , 这 样 在 再 认 的 时 候 只 需要 根据 概念 中 的 物体 进行 
比较 就 可 以 了 。 请 问 康 博 士 ， 座 度 学 习 算 法 里 能 学 习 出 来 稳定 的 概念 吗 ? ” 


康 :“ 这 个 …… 我 需要 证 明 ……” 


贝 : “而且 人 脑 有 专门 的 “where” 通 路 参与 空间 信息 的 人 处理， 这 可 是 结构 上 的 特 
异性 。 为 了 检测 运动 物体 ， 人 类 视觉 系统 能 够 及 时 地 完成 运动 感知 ， 预 测 运动 的 方 癌 
和 速度 ， 这 些 对 运动 信息 的 加 工 有 助 于 大 脑 在 此 基础 上 识别 物体 ， 同 时 运动 信息 也 帮 
助 大 脑 忽 略 背 景 信息 ， 把 注意 力 集中 在 运动 物体 上 ， 这 也 辅助 了 识别 功能 发 挥 作用 ， 
让 更 有 威胁 性 的 运动 物体 首先 被 识别 。 


看 来 这 个 问题 康 博士 要 认输 了 。 实际 上 ， 人 对 运动 信息 的 加 工 和 客体 识别 有 机 地 
捆绑 在 一 起 ， 这 也 并 不 难 理解 ,在 长 期 进化 过 程 中 ， 必 须 这 样 才能 完成 狩 儿 ， 人 能 够 
根据 离散 采样 的 物体 判断 出 运动 方向 (记得 一 个 小 人 在 回 左 转 还 是 癌 右 转 的 例子 吗 ? 
实际 上 就 是 人 脑 恢 复出 来 的 运动 信息 ， 只 不 过 在 “恢复 ”过 程 中 人 的 “注意 ”起 了 很 
大 作用 )， 并 且 运 动 信 息 对 帮助 人 脑 更 好 地 “注意 ”物体 以 辅助 识别 起 到 了 重要 作用 。 
计算 机 在 处 理 运动 信息 时 是 否 引 入 了 “注意 ”机 制 以 区 分 前 景 和 育 隶 ? 摄像头 能 否 像 
眼睛 ( 哪怕 是 一 只 ) 一 样 追 踪 物 体 运 动 ， 或 者 聚焦 在 一 个 物体 上 而 忽视 背景 信息 ?” 这 
些 问题 已 经 超越 了 算法 结构 本 里 的 优化 。 


第 四 个 问题 .在 处 理 深度 信息 方面 ， 谁 更 有 优势 
康 博 士 心里 一 凉 ,终于 轮 到 2D 还 是 3D 的 问题 了 。 


贝 :“ 得 益 于 双眼 结构 , 人 的 3D 视觉 体验 实际 上 是 非常 巧妙 的 。 由 于 左右 眼 之 间 
有 一 定 距 离 ， 感 知 物体 时 视角 并 不 相同 ， 因 此 两 个 2D 信息 投影 到 视网膜 空间 的 信息 
也 有 一 定 差异 ， 在 视 党 皮层 里 合成 为 一 个 物体 ， 同 时 包含 了 深度 、 距 离 的 信息 ， 从 而 
产生 3D 的 立体 视觉 ， 形 成 深度 感知 。 嘿 嘿 ， 康 博士 ， 你 有 什么 要 说 的 ? 人 类 视觉 系 
统 处 理 的 是 3D 信息 ， 用 2D 表示 却 儿 乎 没有 损失 有 用 的 信息 。 计 算 机 能 做 到 吗 ?” 


康 :“ 我 同意 你 的 看 法 ， 不 过 我 还 是 认为 这 对 于 计算 机 来 说 不 太公 平 。 经 过 长 期 
进化 过 程 中 的 实践 ， 人 已 经 能 够 完美 地 把 视觉 对 深度 的 感知 与 实际 距离 联系 起 来 ,让 
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人 脑 从 一 张 静 止 不 劲 的 图 片 中 恢复 出 3D 信息 当然 是 一 件 很 容 多 的 事 。 


贝 :“ 因 为 人 有 对 各 种 各 样 的 场景 里 视觉 物体 的 先 验 信息 ， 比 如 近 大 和 远 小 的 生活 
体验 、 各 种 光照 环境 下 物体 的 融 暗 ， 还 有 对 于 太阳 、 月 腕 、 山 林 、 树 木 、 小 溪 等 相对 
位 置 也 都 会 牢 牢记 住 。 所 以 ， 人 们 看 到 3D 物体 的 一 个 部 分 就 很 容易 “ 补 全 ”整个 3D 
映像 。 


康 :“ 贝 博士 ， 别 得 意 ， 我 要 说 的 是 ， 如 果 给 我 同样 的 数学 模型 在 另 一 个 空间 表 
征 3D 物体 , 同时 给 我 足够 多 的 经 验 来 学 习 , 我 相信 计算 机 也 能 够 处 理 好 3D 视觉 的 问 
题 。 我 要 问 的 是 , 对 于 一 个 人 类 从 来 没有 见 过 的 结构 和 空间 位 置 关 系 很 奇怪 的 新 物体 ， 
人 用 一 只 眼睛 也 能 识别 出 3D 世界 吗 ? ” 


由:“ 这 当然 需要 从 零 开 始 学 习 了 ， 不 过 匈 验 信息 也 会 起 作用 。 比 如 ， 先 用 于 触 
摸 感知 距离 ， 然 后 再 结合 双眼 3D 视 党 经 验 修正 。 


康 :“ 如 果 它 们 互相 冲突 呢 ?” 


贝 :“ 算 你 狠 ! 这 往往 是 很 多 人 类 视 错觉 发 生 的 原因 , 在 2D 恢复 为 3D 的 过 程 中 ， 
有 时 候 人 脑 移 验 知 识 和 图 形 输出 结 朱 之 间 可 能 存在 不 一 致 , 这 时 ,大脑 往往 给 出 两 者 
痢 成 立 的 可 能 ， 并 决定 哪 种 是 真 的 ， 这 就 是 视 错觉。 

这 就 是 人 用 一 只 眼睛 也 能 感 和 3D 世界 的 原因 。 计 算 机 视觉 在 这 方面 还 有 很 多 工 
作 要 做 。 在 信息 获取 阶段 ，3D 视 和 党 信息 影射 到 2D 空间 中 ,摄像 头 实际 上 损失 了 很 多 
言 县 ， 例 如 深度 、 光 照 、 材 质 等 ， 这 些 最 终 都 以 灰 度 值 的 形式 表示 出 来 。 相 比 之 下 ， 
人 的 视 党 系 统 在 这 方面 则 聪明 很 多 , 在 量化 的 同时 还 伴随 春 加 工 。 不 仅 是 一 个 投影 问 
题 ， 同 时 还 提取 出 了 重要 信息 。 所 以 ,计算 机 从 2D 表征 恢复 成 3D 信息 时 , 往往 有 多 
个 可 能 的 解 。 再 加 上 计算 机 不 像 人 脑 那 样 有 长 期 的 学 习 过 程 ， 并 不 能 很 好 地 利用 先 验 
言 居 约 束 求解 过 程 。 因 此 ， 计算 机 通过 单 张 图 像 去 理解 3D 的 场景 就 变 得 困难 了 ,更 
不 可 能 利用 一 个 摄像 头 实 现 人 的 单眼 3D 视觉 功能 。 


第 五 个 问题 ;识别 残 号 图 片 的 能 力 
“这 个 能 力 可 是 婴儿 都 具备 的 哦 ， 康 博士 。” 贝 博士 边 说 边 挤 眉 弄 眼 。 


这 确实 是 人 类 视觉 强大 的 地 方 , 我 们 看 到 的 常常 只 是 物体 的 一 部 分 , 但 这 并 不 影 
啊 我 们 完整 地 识别 出 物体 。 一 个 遇 儿 看 到 笠 果 或 者 奶瓶 的 一 部 分 ， 就 会 守 要 ; 当 妈 妈 
在 窗外 刚刚 露出 半 张 脸 看 他 们 的 时 候 ， 人 婴儿 也 能 及 时 捕捉 。 实 际 上 ,不 要 说 页 儿 的 视 
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党 系统 ， 即 便 是 末 晶 的 视 党 系统 ,也 不 可 能 是 简单 的 模板 匹配 ， 而 是 基于 “概念 ”的 ， 
不 然 只 要 位 置 、 萌 同 稍 微 改 变 一 点 台 将 同一 物体 识别 为 两 个 ， 物 体 被 前 景 稍微 遮挡 一 
部 分 就 不 能 完整 认 出 ， 这 对 生存 无 疑 是 不 利 的 。 


康 :“ 这 个 问题 我 们 也 在 解决 中 ， 虽 然 很 难 ， 不 过 模型 上 我 们 有 能 力 处 理 。 同 态 
滤波 可 以 一 定 程度 上 消除 残缺 信息 ， 例 如 车 牌 上 的 残缺 字符 等 。 有 具体 到 视 党 物体 识别 
上 ， 还 涉及 用 什么 样 的 模型 来 表征 物体 ， 特 别 是 3D 的 视觉 物 体 ， 现 有 的 视网膜 空间 
的 矩阵 翁 怕 难以 满足 。 


贝 :“ 听 起 来 有 道理 ……” 


康 :“ 实 际 上 ， 这 样 的 信息 在 计算 机 领域 是 很 普遍 的 ， 做 产品 匹配 算法 就 必须 面 
对 用 户 遗 漏 的 评价 信息 ， 并 进行 有 机 地 补 全 。 我 要 说 的 是 ， 只 要 给 我 们 时 间 积 累 足 够 
多 的 样本 ， 我 想 这 个 问题 并 没有 前 几 个 问题 那么 难 。 


贝 :“ 我 相信 如 此 ， 毕 竞 我 还 是 要 使 用 京东 来 购物 ， 还 要 去 氏 吧 点 歌 ， 真 布 望 你 
们 的 残缺 信息 补 全 能 够 越 做 越 完 美 , 能够 利用 我 们 提供 的 有 限 的 信息 补 全 成 我 想 要 的 
结 来 。 不 得 不 承认 的 是 ， 在 信息 容量 上 ， 人 脑 不 可 能 和 计算 机 相 比 ， 更 多 地 是 在 模糊 
问题 上 的 求解 上 比较 有 经 验 。 

康 :“ 谢 谢 认 知 科学 家 的 支持 。 诬 度 学 习 算法 一 定 程度 上 能 够 实现 这 些 功能 ,但 
问题 是 我 们 还 不 知道 较 蜗 级 的 层 学 习 到 的 是 不 是 “概念 ”特征 ， 这 些 还 逢 要 不 断 验 证 
和 和 完善。 至 少 在 特定 类 别 物体 的 识别 方面 ， 如 和 车牌 识别 ,计算 机 是 具有 和 较 强 的 补 全 能 
力 的 。 不 过 对 于 人 腔 识 别 ， 如 末 你 挤 眉 卉 眼 ， 或 者 财 上 一 只 眼睛 ， 现 有 算法 可 能 不 能 
完全 识别 ， 毕 苋 计算 机 在 学 习 的 时 候 可 能 从 来 没有 人 教 过 它 那 也 是 人 脸 的 一 种 ……” 


册 :“ 对 了 ， 计 算 机 专家 ， 如 朱 你 确实 对 概念 表征 有 兴趣 ， 推 存 你 谈 一 本 书 ， 书 
的 名 字 在 这 张 图 片 ( 见 图 7-4 ) 里 ,你 可 以 用 你 的 算法 识别 一 下 ， 哈 喻 1” 


看 来 在 这 个 问题 上 ， 康 博士 和 贝 博 士 空前 地 达成 了 一 致 。 毕 葛 现 在 讨论 的 不 是 谁 
取代 谁 的 问题 ， 而 是 如 何 发 挥 各 日 优势 的 问题 。 即 便 人 脑 在 很 多 方面 部 具有 优势 ,但 
是 信息 拉 术 的 发 展 已 经 越 来 越 多 地 改变 了 人 类 的 生活 , 解决 了 很 多 人 类 并 不 擅长 处 理 
的 问题 。 只 是 有 些 问题 解决 起 来 还 不 那么 智能 。 这 也 可 以 理解 ， 因 为 这 些 问 题 本 来 束 
是 “人 的 问题 "， 从 问题 的 提出 到 评价 都 是 按照 人 的 标准 来 进行 的 ， 人 们 会 很 目 然 地 
把 计算 机 做 得 如 何 和 人 的 行为 结 来 做 比较 ， 而 这 本 号 就 不 太公 平 。 
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图 7-4 ”残缺 信息 补 全 的 例子 ， 人 人 都 是 补 全 专家 


第 六 个 问题 : 论述 一 下 各 目 系 统 的 优势 


康 博 士 说 :“ 计 算 机 在 处 理 速度 方面 有 优势 ， 可 以 连续 工作 ， 另 外 大 型 数据 库 可 
以 存储 的 容量 远 远大 于 人 脑 ， 只 不 过 人 脑 的 信息 处 理 模式 可 能 极为 智能 ……” 


贝 博士 一 边 点 头 一 边 翻 看 手 里 的 认 知 科学 文献 :“ 对 ， 人 脑 实 际 上 并 不 是 存储 全 
部 的 信息 ， 而 是 在 编码 的 时 候 就 进行 了 压缩 ， 无 用 信息 被 忽略 控 了 ， 而 且 在 海马 作用 
下 ,信息 被 广泛 地 加 以 连接 ， 这 些 痢 提高 了 提取 的 准确 性 。” 


康 :“ 在 智能 化 方面 ， 我 们 承认 人 脑 具 有 极 大 的 优势 。 


贝 : “确实 ， 人 脑 对 信息 表征 和 层次 化 加 工 是 智能 化 的 重要 保证 。 以 视 沉 为 例 ， 
言 县 获取 的 时 候 伴随 春 多 个 层级 的 表征 ， 同 时 完成 了 简单 的 加 工 ， 而 后 科 选 出 有 用 的 
信息 ， 完 成 蜗 级 加 工 。 这 些 是 初级 视觉 皮层 大 量 神经 元 协同 工作 完成 的 ， 神 经 元 之 间 
通过 不 同 频 率 的 电信 号 调制 , 形成 具有 特定 功能 的 群体 。 这 些 和 深度 学 习 的 结构 有 些 
类 似 。 

康 :“ 不 过 深度 学 习 还 远 没 有 达到 完美 的 境界 , 特别 是 在 如 何 利 用 先 验 信息 方面 ， 
其 至 不 知道 “学 习 ” 到 的 特征 的 物理 和 心理 含义 ,而 且 结 构 的 优化 也 没有 系统 的 理论 
指导 。 不 过 人 类 目 然 选 择 也 没有 ， 更 多 是 实践 出 来 的 。 
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册 :““ 注 意 ” 机 制 是 值得 计算 机 学 习 的 一 个 功能 ， 它 不 同 于 进程 调度 ， 也 不 同 
于 视觉 信息 获取 阶段 摄像 头 的 调和 。 实 际 上 是 影响 识别 效果 的 重要 因素 ， 对 于 复杂 场 
景 、 运 动物 体 的 识别 具有 重要 意义 ， 也 在 一 定 程度 上 影响 了 特征 捆绑 。 据 我 所 知 ， 计 
算 机 算法 里 还 没有 对 “local-first” 还 是 “global-first ”给 出 答案 吧 ? ” 


通过 这 场 对 话 ， 康 博士 和 贝 博 士 对 人 工 智能 和 人 脑 智能 都 有 了 更 次 入 的 了 解 。 也 
许 他 们 应 该 合作 开发 一 个 更 智能 化 的 处 理 系 统 , 把 人 和 计算 机 有 机 地 联系 在 一 起 ,用 
人 脑 来 处 理 人 类 擅长 加 工 的 信息 并 把 结 来 反馈 给 计算 机 ,让 计算 机 来 进行 后 续 的 快速 
加 工 。 相 比 完 全 取代 人 脑 的 人 工 知 能 研究 ， 这 种 各 司 其 职 的 人 机 交互 也 许 是 未 来 智能 
的 发 展 趋 扬 。 


人 脑 认 知 功能 对 机 器 学 习 算法 的 局 示 


在 前 面 康 博士 和 贝 博士 的 过 招 中 , 我 们 初步 了 解 了 两 种 不 同 识别 机 制 的 异同 和 各 
目的 优势 。 下 面 我 们 就 对 话 中 提 到 的 人 的 认 知 功能 进行 延伸 讨论 ， 看 看 有 什么 结构 和 
功能 上 的 特点 值得 信息 科学 借鉴 。 


我 们 可 以 大 致 将 人 的 识别 过 程 抽 旬 为 一 个 模型 ， 如 网 7-5 所 示 ， 这 一 模型 只 是 示 
意 性 的 ， 供 大 家 了解 清楚 问题 ， 并 不 一 定 是 认 知 科 竺 中 真实 的 加 工 模 型 。 


引 


~ PE — 


图 7-5 ”视觉 信息 加 工 流程 示意 医 
我 们 首先 来 看 一 下 人 是 如 何 识别 物体 的 。 面 孔 是 人 类 生活 中 常见 的 物体 ， 它 携 市 


有 丰富 的 信息 ， 从 复杂 的 场景 中 识别 、 检 测 人 脸 以 及 辨别 人 脸 的 个 体 信息 等 具有 重要 
的 意义 ， 因 此 面孔 识别 的 相关 认 知 机 制 以 及 面孔 加 工 的 特异 性 始终 被 大 量 学 者 关注 。 
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以 面孔 为 代表 的 视觉 物体 信息 经 过 视网膜 、 外 膝 体 之 后 ,大致 经 过 初级 和 高 级 视觉 
层 逐 级 的 表征 和 加 工 ， 这 一 过 程 受 到 注意 环 路 的 调节 和 控制 ， 从 而 引导 我 们 发 现任 务 
需要 我 们 提前 注意 的 特征 和 物体 自身 醒目 的 特征 ， 完 成 感知 、 区 分 和 识别 过 程 ， 先 后 
实现 判断 “是 人 脸 还 是 桌子 ”和 “是 我 认识 的 人 吗 ? 他 叫 什么 ? 在 哪 工 作 ? ”等 过 程 ， 
随后 还 启动 了 记忆 系统 来 完成 再 认 和 回忆 (是 否认 识 或 若干 年 前 在 某 处 见 过 他 )、 语 
义 判 断 ( 他 的 名 字 等 语义 信息 )、 情 绪 加 工 〈 他 看 起 来 不 高 兴 ， 让 我 不 舒服 ) 等 有 关 
的 高 级 加 工 。 


这 是 一 个 非 第 抽象 化 的 加 工 模型 ， 有 助 于 解释 面孔 和 复杂 物体 的 加 工 。 我 们 首先 
可 以 看 出 信息 加 工 是 层次 化 的 ， 逐 级 加 工 从 简单 到 复杂 的 特征 ， 从 V1 到 V2、IT 区 ， 
每 个 层级 都 对 视觉 信息 有 各 目的 表征 ， 提 取 从 线段 戎 回 、 人 简单 特征 组 合 到 复杂 特征 等 
不 同 的 特征 ， 感 知 、 识 别 等 认 知 加 工 也 是 伴随 着 每 个 层级 的 表征 进行 的 。 而 这 些 表征 
和 加 工 都 是 通过 多 个 层级 的 神经 元 群体 的 同步 活动 来 实现 的 。 单 个 神经 元 负责 表征 极 
为 简单 的 信息 ,但 是 通过 和 群体 组 合 在 一 起 〈 通 过 神经 电 活动 有 有 律 的 同步 震荡 完成 组 
织 ) 就 能 表达 复杂 的 功能 。 从 信息 科学 的 角度 看 ， 整 个 加 工 过 程 的 实现 可 以 理解 为 复 
杂 的 多 次 特征 提取 过 程 ， 提 取 的 特征 从 倘 单 到 复杂 ， 多 次 组 合 ， 甚 至 “概念 ”这 种 十 
分 抽象 的 特征 也 可 以 被 提取 。 因 此 我 们 不 难看 出 现 有 计算 机 视觉 领域 物体 识别 算法 的 
局 限 性 , 也 不 难 理解 污 人 的 识别 过 程 有 类 似 之 处 的 这 度 学 习 等 算法 一 定 有 内 在 结构 特 
所 做 保证 。 


实际 上 ， 人 的 物体 识别 过 程 不 仅仅 是 判断 当前 信息 属于 什么 大 的 类 别 这 么 简单 ， 

它 还 和 注意 、 情 绪 等 系统 有 春 极 强 的 交互 作用 ， 这 些 功能 次 这 地 影 啊 识 别 。 有 些 影 啊 
发 生 在 相当 早期 的 阶段 。 比 如 焦虑 、 抑 郁 等 情感 疾病 的 患者 对 负 性 情绪 信息 有 注意 偏 
问 , 对 市 有 负面 色彩 的 情绪 刺激 更 容易 关注, 这 种 注意 俩 问 发 生 在 视 党 感知 早期 阶段 。 
而 这 用 逐 级 加 工 的 模块 化 理论 是 不 可 能 解释 的 , 无 疑 提示 注意 和 情绪 与 认 知 的 交互 作 
用 远 比 我 们 理解 的 要 早 要 基础 ， 是 目 动 化 加 工 的 。 为 了 避免 把 问题 复杂 化 ,我 们 在 上 
述 模型 中 没有 考虑 情绪 问题 ， 不 但 没 涉及 识别 物体 的 人 的 目 且 情绪 状态 的 变化 ， 而 且 
还 假设 物体 所 具有 的 物体 附带 的 表情 都 保持 中 性 。 然 而 ， 实 际 上 人 的 傅 绪 加 工 远 比 想 
象 中 要 基础 ， 绝 非 中 晚期 才 局 动 的 高 级 过 程 。 这 是 人 的 认 知 功能 的 基本 特点 。 


这 些 加 工 过 程 对 应 的 是 模块 化 的 加 工 单 元 ,遍布 于 大 脑 不 同 脑 区 〈 我们 也 许 没 必 
要 牢记 每 个 脑 区 的 名 字 和 位 置 )， 这 些 单元 往往 不 是 单一 的 一 个 区 域 完 成 的 ， 有 些 单 
元 分 布 需要 多 个 脑 区 协同 完成 , 这 种 类 似 多 重 备份 的 设计 的 好 处 是 复杂 目 然 环境 中 
故 损毁 部 分 区 瑾 ， 不 会 导致 识别 功能 完全 次 痪 (如 采 你 了 解 神 经 外 科 手 术 通 稼 要 切除 
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多 大 一 片 脑 区 ， 束 会 对 人 脑 功 能 有 更 诬 刻 的 认识 ,惊讶 于 原来 没有 菏 块 脑 区 ， 人 居然 
还 可 以 完好 地 存活 。( 最 近 一 例 报 道中 提 到 非常 罕见 的 一 位 小 脑 完全 缺失 的 患者 竞 然 
可 以 长 期 存活 ) 她 的 不 正常 表现 竟然 只 是 走路 不 稳 和 轻微 的 发 音 不 清 。 不 过 有 些 重 要 
功能 区 的 损毁 乃至 连接 两 个 功能 区 之 间 的 传导 束 损 伤 , 确实 会 带 来 诸如 “面孔 失 认 证 ” 
竺 功能 缺陷 ， 可 能 表现 为 不 能 辨别 出 人 脸 或 者 某 种 物体 ， 或 者 能 够 说 出 物体 的 功能 ， 
但 是 难以 命名 或 者 错误 判断 为 类 似 但 是 完全 不 同 的 另 一 类 物体 (还 是 一 位 神经 外 科 医 

告诉 我 的 实际 例子 , 患者 连接 两 个 最 重要 的 语言 区 Broca 区 和 Wernicke 区 之 间 的 马 
状 束 纤维 受到 肿瘤 压迫 ,结果 她 始终 无 法 说 出 呈现 在 眼前 的 钥匙 的 中 文 名 字 , 但 是 能 
明确 措 述 出 它 是 用 来 开门 的 ， 还 杀手 操作 用 法 ， 最 后 盘 急 了 说 是 瓶 起 子 一 一 从 这 个 活 
生生 的 例子 中 ， 我 们 可 以 更 好 地 理解 人 脑 是 如 何 存储 、 加 工 不 同 概念 的 ) 这 一 点 在 
很 多 脑 损伤 或 者 脑 刺 激 实 验 中 部 得 到 了 大 量 验证 。 


在 物体 识别 过 程 中 , 前景 和 背景 分 割 过 程 扮演 着 很 重要 的 角色 。 这 也 是 人 的 识别 

鲁 棒 性 的 重要 体现 ， 特 征 提 取 和 去 噪 是 同步 完成 的 ， 即 在 对 感 兴趣 的 物体 进行 表征 的 

同时 完成 了 背景 噪音 的 去 除 。 这 里 重要 的 结构 特点 就 是 前 景 信 息 的 表征 ， 其 中 圳 括 了 

量 细 市 信息 的 表征 ， 还 有 注意 过 程 的 参与 一 一 我 们 感 兴趣 的 区 域 的 表征 是 更 精细 

的 ， 这 有 助 于 我 们 看 清楚 想 要 关注 的 人 的 面孔 ,对 于 背景 信息 ， 则 至 多 只 会 你 持 大 玉 
度 的 轮廓 。 


前 景 的 判断 是 人 类 经 过 亿 万 年 学 习 的 ,进化 出 了 对 特定 信息 敏感 的 神经 元 ， 并 经 
过 遗传 进化 一 代 一 代 优化 到 今天 。 而 背景 的 分 割 和 遮挡 信息 的 处 理 则 是 人 特殊 的 表征 
机 制 在 起 作用 ， 虽 然 当 前 物体 不 完整 ,但 是 丝 营 不 影响 我 们 利用 已 有 的 信息 对 其 进行 
脑 补 ， 这 一 机 制 虽然 还 没有 研究 清楚 ， 但 是 特征 补 全 机 制 对 于 擅长 大 数据 的 计算 机 科 
学 家 来 说 并 不 陌生 。 而 人 类 亿 万 年 所 “处 理 ” 的 物体 和 人 脸 绝 对 可 以 称 得 上 是 大 数据 ， 
只 是 在 存储 和 特征 利用 方面 更 有 效 ， 将 最 核心 的 信息 巧妙 地 通过 生理 结构 固化 下 来 。 


在 两 位 博士 的 争论 中 ， 我 们 提 到 了 注意 功能 。“ 注 意 ” 实 际 上 是 一 种 资源 调度 和 
分 配 的 过 程 。 长 期 的 进化 过 程 ， 特 别 是 残酷 的 目 然 选择 过 程 为 我 们 优化 出 了 高 级 的 注 
意 功 能 ， 既 要 保持 对 当前 加 工 任务 的 资源 投入 ， 又 要 时 刻 警 醒 外 界 刺 激 。 对 有 威胁 性 
的 刺激 ， 要 及 时 打 断 当前 任务 ， 快 速 作出 啊 应 。 很 多 人 工 智能 系统 ， 如 采 能 信 鉴 “日 
上 而 下 ”和 “从 的 至 项 ”两 个 注意 通路 的 特点 ， 对 于 复杂 识别 和 退 踊 问题 的 解决 将 有 
重要 意义 。 也 许 人 工 智能 要 做 的 并 不 仅仅 是 实现 和 人 相同 的 注意 功能 ， 甚 至 不 需要 引 
入 “注意 ”这 样 一 个 概念 ， 但 是 类 似 的 高 度 智能 化 的 “进程 调度 ”也 许 是 必要 的 ， 它 
不 是 按 预 设 顺序 进行 的 过 程 化 加 工 ， 也 不 是 单 帮 机 中 随意 粗 又 的 “中 断 ”， 而 应 该 是 
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对 当前 任务 特点 、 重 要 性 和 后 果 有 一 个 综合 评价 之 后 得 出 的 优化 结论 ， 而 这 些 都 需要 
高 级 的 调度 与 底层 的 任务 之 间 保 持 展 好 的 交互 机 制 。 

以 上 我 们 介绍 了 静止 场景 下 的 识别 过 程 ， 实际 上 ,运动 的 物体 也 许 会 更 有 效 地 帮 
助 我 们 将 其 从 背景 中 分 割 开 来 这 也 是 人 类 进化 的 结果 。 我 们 远古 的 祖先 必须 有 这 人 么 
一 项 优越 的 功能 ， 才 能 完成 狩 猛 ， 从 而 生存 下 来 。 其 中 还 涉及 三 维 视 觉 等 环 市 ， 这 也 
和 计算 机 视觉 对 视觉 信息 的 表征 有 着 本 质 区 别 。 

在 完成 和 运动 物体 空间 位 置 有 关 的 快速 识别 的 过 程 中 ,人 的 视觉 系统 进化 出 了 独 
特 的 两 个 彼此 独立 的 信息 加 工 通路 : 腹 侧 通路 和 背 侧 通路 。 它 们 分 别 与 物体 识别 和 空 
间 位 置信 息 的 感知 有 关 ， 因 此 也 叫 what 通路 和 where 通路 (或 者 how 通路 )， 由 此 可 
以 看 出 ， 人 的 识别 绝 非 理 想 环境 下 通过 匹配 进行 的 单纯 的 “识别 ”， 而 是 与 诸多 加 工 
紧密 相连 并 行 处 理 的 。 

钢 范 信息 呈现 给 人 类 以 后 ,会 从 视网膜 流 问 到 初级 视觉 皮层 V1， 然 后 沿 痢 腹 侧 
和 背 侧 两 条 通路 传输 到 杜 叶 皮层 和 后 项 叶 等 高 级 区 域 。Bruce 和 Young 两 位 科学 家 系 
统 地 提出 了 针对 面孔 认 知 模块 和 功能 的 模型 。 根据 这 一 模型 ， 面 筷 加 工会 被 几 个 独立 
的 功能 模块 在 不 同 的 阶段 进行 加 工 。 首先 是 面孔 信息 的 结构 编码 阶段 ,然后 面孔 独立 
于 表情 的 特征 和 空间 结构 的 编码 信息 进入 第 二 阶段 。 这 一 阶段 包括 两 个 平行 的 通道 ， 
第 一 个 通道 包含 3 个 相互 平行 的 处 理 单元 ， 分 别 负责 面孔 表情 分 析 、 面 孔 声 言 分 析 和 
直接 视觉 处 理 等 功能 ; 另 一 个 通道 有 关 面 也 身份 识别 ， 包 含 面 孔 识 别 单元 、 个 体 身 份 
方 点 和 名 字 产 生 模块 等 3 个 串 行 的 过 程 ， 对 个 体 身 份 信息 进行 辨认 。 这 两 条 分 离 通道 
的 输出 结果 最 后 都 汇集 到 认 知 系统 ， 以 便 对 信息 进行 综合 处 理 和 决策 。 这 个 模型 指明 
了 与 面孔 识别 有 关 的 功能 单元 和 不 同 的 加 工 阶段 ,并且 强调 了 面孔 吴 份 信息 识别 和 面 
孔 表 情 加 工分 别 对 应 两 条 独立 的 通道 , 能 够 从 理论 上 很 好 地 解释 熟悉 的 面孔 如 何 被 识 
别 。 近 年 来 ， 有 研究 者 根据 面孔 加 工 神 经 机 制 的 研究 ， 对 Bruce 和 Young 模型 进行 了 
修改 补充 或 提出 了 新 的 模型 ， 强 调 了 功能 横 块 的 实现 脑 区 与 脑 区 间 的 连接 情况 。 面 孔 
加 工 模型 对 于 我 们 理解 多 种 物体 识别 机 制 具 有 重要 启示 。 

相 比 之 下 ,计算 机 识别 的 过 程 就 显得 不 那么 贸 能 了 ,摄像 机 经 历 了 及 样 量化 以 后 ， 
完成 了 对 视觉 信息 的 初始 表征 ， 从 此 表征 和 加 工 束 截然 分 开 。 在 大 致 经 过 痛 景 分 割 、 
配 准 环节 后 ， 针 对 感 兴 趣 物体 特征 进行 中 心 化 、 拍 化、 标准 化 等 预 处 理 步 台 ,下面 的 
工作 就 是 单纯 的 “判别 ”。 到 背景 分 割 阶段 以 后 ， 感 兴趣 的 物体 就 已 经 和 背景 以 及 周 
围 物 体 信 息 不 再 有 信息 交互 ， 等 待 它们 的 就 只 有 特征 提取 ， 投影 到 某 一 子 空间 ， 人 然后 


区 由 分 类 天 判别 。 
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与 人 的 视 党 层次 化 加 工 相 比 , 计算 机 视觉 的 表征 主要 来 日 于 信息 获取 最 初始 阶段 
光学 传 感 带 用 矩阵 对 两 维 的 视 党 信息 的 表征 , 这 一 次 表征 的 结 末 几乎 吐 穿 了 处 理 的 全 
过 程 。 计 算 机 的 整个 加 工 过 程 往往 没有 “注意 ”过 程 参 与 ， 也 没有 过 多 地 与 背景 信息 
进行 比较 做 特征 拥 绑 ， 各 个 层级 的 加 工 是 单独 进行 的 。 而 人 的 加 工 则 是 多 层级 的 ， 每 
一 层级 都 伴随 大 对 信息 不 同 层 次 的 表征 ( 如 线段 朝 癌 、 人 简单 几何 形状 到 抽象 的 概念 信 
县 表征 )。 表 征 和 加 工 往 往 是 同时 进行 的 ， 在 对 视觉 信息 内 容 进 行 特定 表征 的 同时 束 
完成 了 这 一 层级 的 加 工 , 这 和 以 单纯 特征 提取 为 目的 的 线性 或 非 线 性 变换 有 本 质 的 区 
别 ， 也 降低 了 对 分 类 融 性 能 的 依赖 。 


实际 上 , 单 就 分 类 判别 本 有 身 也 有 竺 进一步 优化 。 我 们 可 以 将 其 类 比 为 人 类 的 决策 
过 程 。 有 研究 指出 ， 人 的 决策 过 程 也 是 一 个 目 动 化 的 加 工 ， 可 能 不 是 我 们 理解 的 那 种 
主观 性 很 强 的 高 级 的 加 工 。 有 理论 认为 决 宁 过 程 就 是 感知 阶段 以 后 所 有 证 据 的 素 积 形 
成 的 “ 目 然 而 然 ”的 绪 有 末 。 这 一 氮 对 我 们 设计 分 类 融 具 有 重要 局 发 ， 隐 含 的 意思 可 能 
就 是 特征 提取 和 分 类 同时 进行 。 而 对 于 分 类 带 是 有 监督 的 还 是 无 监督 的 , 认 知 科学 实 
际 上 也 已 经 有 了 答案 。 对 于 特定 分 类 问题 来 说 (仅仅 用 于 识别 是 否 为 人 脸 )， 可 能 
监督 的 效果 更 好 ,但 是 这 可 能 无 法 适用 于 识别 多 类 别 的 问题 。 有 理论 认为 ， 视 听觉 信 
县 的 加 工 应 该 是 无 监督 的 , 归 儿 在 接触 各 种 信息 的 时 候 并 没有 父母 给 出 的 各 种 标签 做 
标记 ， 需 要 徘 目 己 从 规律 中 总 结 ， 他 们 能 够 在 长 期 的 学 习 中 形成 类 别 的 特点 。 


此 外 ,计算 机 的 整个 加 工 流程 是 相对 固定 的 , 这 些 计 算 机 算法 的 结构 往往 没有 大 
量 的 优化 过 程 ， 用 于 学 习 的 样本 在 相当 长 的 时 期 内 也 不 够 多 ， 以 前 都 没有 足够 大 ， 难 
以 与 人 类 亿 万 年 的 进化 和 无 时 无 刻 不 在 进行 的 “可 塑性 学 习 ” 相 比 。 人 脑 的 可 塑性 无 
时 无 刻 不 在 发 挥 作用 ,改变 大 日 质 纤维 的 连接 (或 许可 以 不 恰当 地 类 比 为 神经 网 络 市 
点 之 间 的 权重 )。 


综 上 所 述 , 当 科 学 家 们 开发 出 具有 类 似 人 脑 的 层次 化 加 工 结构 的 深度 学 习 算 法 以 
后 ， 识 别 效 果 能 够 得 到 极 大 的 提升 也 就 不 难 理解 了 。 


在 以 上 讨论 的 信息 获取 、 表 达 、 识 别 环 节 中 ,我 们 没有 强调 一 个 重要 的 环 有 一 一 
存储 ， 而 是 假设 它 容 量 无 限 大 、 提 取 速 度 足够 快 。 这 对 于 计算 机 来 讲 ， 也 许 不 是 很 重 
要 的 问题 , 但 是 在 实际 应 用 中 对 存储 空间 有 严格 限制 的 条 件 下 ， 这 也 许 是 一 个 重要 的 
制约 因素 。 事 实 上 ， 信 息 的 存储 不 仅仅 是 长 久保 存 的 问题 。 存 储 方式 极 大 地 影响 看 能 
否 实现 便捷 提取 , 而 在 信息 加 工 过 程 中 不 可 避免 地 要 涉及 提取 已 有 模型 、 参 数 、 模 板 、 
守 征 甚 至 数据 本 里 进行 比较 和 判别 。 人 的 视觉 信息 存储 是 十 分 精巧 的 ,依赖 强大 的 记 
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忆 功 能 实现 ; 人 的 记忆 过 程 不 仅仅 是 信息 存储 的 过 程 , 还 伴随 着 特征 提取 整合 的 过 程 。 
记忆 的 过 程 从 某 种 意义 上 讲 是 “忘记 ”的 过 程 ， 是 无 用 信息 修建 、 有 用 信息 整合 的 过 
程 ， 这 实际 上 就 是 又 一 次 特征 提取 的 过 程 。 也 许 人 类 记忆 的 容量 无 法 和 硬盘 相 比 ， 但 
是 人 类 记忆 的 效率 和 智能 化 程度 远 远 高 于 计算 机 ,能够 对 有 用 的 细节 信息 进行 精细 表 
征 ， 对 无 用 的 帝 识 性 信息 选择 性 遗志 。 而 且 每 一 次 识别 过 程 午 是 一 次 学 习 ， 这 套 学 习 
机 制 人 允许 我 们 完美 地 继承 了 先 斐 们 学 习 的 结果 , 又 保持 了 对 新 知识 的 适应 性 。 可 以 说 ， 
人 脑 精 马 的 存储 机 制 是 学 习 和 智能 化 的 重要 保证 , 这 些 特点 邦 对 视听 信息 的 识别 有 重 

影响 。 计 算 机 固然 在 存储 容量 和 提取 速度 方面 有 很 大 的 提升 空间 和 比较 优势 ,但 是 
在 茶 些 场合 ， 如 何 设计 得 马 妙 一 些 而 不 是 把 所 有 信息 全 都 原封 不 动 地 存 下 来 ， 是 不 得 
不 考虑 的 现实 问题 。 


考虑 了 很 多 人 脑 的 识别 优势 以 后 , 也 许 有 人 会 想到 如 何 利 用 好 人 脑 的 识别 优势 为 
计算 机 服务 。 可 行 的 思路 有 两 条 , 一 是 模拟 人 脑 识别 的 机 制 ， 用 数学 模型 和 参数 加 以 
表示 ,模拟 出 人 脑 功能 类 似 的 计算 机 算法 ,实现 人 工 贸 能 。 例 如 ,我们 可 以 研究 人 脑 
神经 网 络 的 结构 特点 ,模拟 出 类 似 的 结构 ,实现 相 应 的 功能 ; 也 可 以 借鉴 人 的 图 像 理 
解 机 制 ， 将 人 对 3D 场景 深入 信息 的 先 验 信息 赋予 计算 机 ， 带 助 计算 机 通过 分 析 图 像 
以 外 的 深度 信息 ， 利 用 这 些 信 息 去 辅助 3D 重 构 。 


二 和 是 直接 利用 人 的 认 知 功能 ,首先 对 复杂 视听 筑 信 息 进 行人 的 加 工 处 理 ， 然 后 把 
结果 交 由 计算 机 深入 分 析 。 这 种 有 人 脑 辅助 的 “ 认 知 计算 ”是 人 工 智能 领域 研究 的 热 
门 方 向 ， 类 似 的 有 美国 科学 家 实现 了 利用 人 脑 活动 的 脑 电 波 信 号 进行 搜索 引擎 ,或 者 
直接 从 人 观看 视觉 物体 诱发 的 脑 活 动 中 解码 类 别 甚至 个 体 本 里 ,因为 毕 苋 人 脑 更 了 解 
日 己 。 人 脑 活动 包含 很 多 状态 性 的 生物 信息 ， 利 用 好 这 些 信息 ， 对 于 满足 人 目 肌 的 需 
求 也 许 更 有 玫 助 ,年 竞 计 算 绪 来 好 坏 的 评价 准则 是 根据 为 人 服务 的 好 坏 来 衡量 的 。 在 
利用 人 的 认 知 功能 进行 计算 方面 ,研究 者 们 普 过 将 多 种 神经 影像 工具 与 机 人 学 习 算 法 
相 结 合 ， 相 信 这 些 研究 成 末 会 为 人 工 智 能 、 人 机 交互 系统 开发 捉 供 重要 的 局 未 。 


关于 人 工 智 能 与 人 上 脑 智能 的 一 点 思考 


估计 最 初 接触 人 脑 机 制 的 信息 科学 人 研究 者 部 试图 把 人 脑 比 作 数 字 信 号 处 理 带 
(DSP )， 认 为 人 脑 只 需 进 行 简 单 运算 ， 而 眼睛 和 摄像 机 功能 类 似 ， 只 负责 简单 的 信息 
获取 。 实 际 上 ， 经 过 深入 了 解 以 后 ,我们 发 现 这 种 类 比 既 正 硝 又 不 正确 。 人 脑 进行 的 
是 复杂 的 计算 , 其 智能 化 程度 绝 非 现 有 DSP 可 以 比拟 , 眼睛 等 感知 需 官 与 注意 、 意 识 
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等 局 级 认 知 功能 有 很 强 的 交互 作用 ,不 仪 仅 是 早期 的 信息 获取 过 程 。 有 文献 指出 ,了 眼 
至 瞳孔 直径 大 小 可 以 反映 学 习 过 的 内 容 再 认 的 效果 ,而 眼 动 规律 也 和 很 多 社会 认 知 能 
力 密切 相关 。 

也 许 我 们 没 必要 模拟 出 一 个 和 人 脑 功能 一 模 一 样 的 计算 机 来 ， 那样 没 有 实际 章 
义 ， 重要 的 全 怕 还 是 实现 类 似 的 功能 。 计 算 机 和 人 脑 对 信息 的 表征 有 看 本 质 的 区 别 ， 
计算 的 结构 也 不 同 ， 能 够 获取 的 样本 数 也 有 差别 。 毕 竞 人 已 经 进化 亿 万 年 了 ， 因 此 不 
能 奶 求 计算 机 算法 具有 与 人 的 管 能 类 似 的 准确 这 和 推广 能 力 。 问题 在 于 计算 机 服务 的 
对 象 是 人 ,实际 需求 也 是 辅助 人 来 实现 类 似 的 认 知 功能 ,用 户 不 可 避免 地 将 计算 结 采 
与 人 的 认 知 过 程 作 比 较 ,， 并 用 人 的 处 理 结 灯 来 评价 计算 机 算法 的 优 劣 。 束 识 别 本 里 而 
言 , 目前 人 脸 识 别 程序 已 经 做 得 很 好 ， 目 然 语 言 处 理 也 已 经 发 挥 了 巨大 作用 ， 在 这 些 
算法 里 并 不 需要 体现 过 多 的 人 的 因 系 。 不 过 ,估计 用 户 不 会 满足 于 一 个 计算 机 识别 系 
统 只 能 正确 地 识别 一 类 物体 ,他 们 会 很 卓然 地 要 求 设计 的 系统 能 够 像 人 一 样 处 理 视听 
觉 信息 ， 这 怒 怕 是 推动 计算 机 像 人 一 样 工 作 的 动力 。 


现在 可 能 已 经 没有 必要 讨论 人 和 计算 机 谁 更 好 这 个 问题 了 ,更 重要 的 是 利用 好 两 者 
的 优势 , 更 好 地 解决 实际 问题 。 在 处 理 人 和 计算 机 的 关系 问题 上 , 一 种 办 法 是 模拟 人 的 
思维 过 程 , 利用 从 结构 到 功能 的 特点 ， 实现 类 似 的 智能 。 人 类 在 这 一 关系 中 人 处 于 服务 对 
象 角色 , 最 近 十 分 热门 的 深度 学 习 属 于 这 一 类 的 实例 。 还 有 一 种 想法 是 直接 利用 人 的 认 
知 功 能 , 将 部 分 计算 机 不 适宜 完成 的 复杂 的 计算 任务 由 人 来 完成 ,人 直接 参与 到 了 计算 
之 中 , 与 计算 机 各 自分 工 。 这 类 有 人 脑 辅 助 的 “ 认 知 计算 ”研究 也 已 经 取得 了 很 多 成 果 。 
例如 ,美国 EGI 公 司 利 用 人 的 超 强 图 像 处 理 能 力 从 海量 遥感 卫星 获取 的 图 像 中 检索 异常 
物体 , 用 快速 视觉 呈现 的 方式 将 大 量 卫星 图 片 呈现 给 参与 实验 的 人 。, 与 传统 人 工 操作 相 
比 , 这 家 公司 在 人 进行 检查 的 同时 记录 了 人 脑 活动 的 脑 电波 , 一 旦 发 现 异常 物体 , 脑 电 
诗人 总 中 会 有 特异 性 反应 成 分 。 而 这 套 系 统 的 另 一 个 优势 是 直接 检测 脑 活动 , 可 以 不 需要 
人 的 意识 参与 , 能 够 在 刺激 呈现 后 短 时 间 内 发 现 异 背 , 并 且 在 前 一 幅 图 片 加 工 完 之 后 蕊 
上 呈现 男 一 幅 图 片 ， 而 无 需 等 人 按键 决策 。 通常 需 要 人 作出 决策 、 按 键 反馈 等 高 级 认 知 
加 工 害 要 耗费 很 多 时 间 , 而 下 接 利 用 脑 的 识别 功能 , 绕 开 耗 时 的 决策 和 反应 , 与 计算 机 
对 接 ， 就 极 大 地 提 高 了 检测 效 座 。 类 似 地 ， 美 国 哥 伦比 亚 大 学 的 Paul Sajda 教授 研究 组 
进行 了 很 多 利用 视觉 信息 进行 物体 快速 归 类 的 实验 。 近 年 来 还 利用 人 对 物体 类 别 感知 过 
程 的 脑 活动 特征 建立 了 数据 库 , 实现 了 利用 人 特征 进行 网 片 检 索 的 引擎 。 还 有 一 部 分 认 
知 计算 应 用 是 利用 人 的 认 知 活动 百 接 为 人 服务 的 , 例如 计算 出 人 的 情绪 活动 的 状态 , 给 
予 人 实时 的 反馈 调节 ,协助 用 户 找 到 保持 良好 状态 的 策略 ( 例如 Neurosky 的 系列 产品 )。 
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这 种 神经 反馈 的 应 用 已 经 用 于 情绪 调节 和 注意 力 训 练 等 领域 , 无 一 不 是 恰当 地 利用 了 人 
的 认 知 优势 ， 实 现 了 有 机 的 人 机 协同 。 

多 年 来 人 们 对 两 个 学 科 进 行 了 许多 探索 。 在 心理 学 人 研究 方法 中 , 事件 相关 电位 技 
术 ( ERP ) 是 一 种 第 用 的 探索 时 序 加 工 特点 的 技术 。 通 第 对 于 多 次 刺激 得 到 的 脑 活 动 
采用 全 加 平均 的 方法 ,得 到 最 小 均 方 误差 准则 下 的 估计 ， 实际 上 就 是 脑 活动 的 均值 。 
这 与 近年 来 “平均 脸 ”( 见 图 7-6 ) 的 研究 方法 很 相似 ,文章 指出 平均 得 到 的 面孔 最 有 
代表 性 。 通过 一 些 脑 电 早期 的 文献 可 知 , 原来 早期 脑 电 图 研究 者 就 是 受到 了 “平均 脸 ” 
方法 的 局 发 ,将 脑 活 动 也 类 似 地 平均 了 ,得 到 了 有 代表 性 的 波形 ， 从 而 影响 了 认 知 科 
学 的 发 展 。 而 后 人 们 显然 忽视 『 了 来龙去脉， 这 两 个 等 科 的 距离 居然 如 此 之 近 ! 


类 似 地 ,在 计算 机 的 面孔 识别 研究 中 ， A 利用 PCA 
分 解 出 特征 向 量 ， 分 类 结果 往往 较 好 ， 不 过 背后 的 原理 不 太 容 易 讲 清楚 。 而 上 一 例 平 
均 脸 更 具 美 感 的 结论 也 an 
“ 脸 ” 的 概念 模板 一 致 有 关 ? 那么 深度 学 习 学 习 出 来 的 脸 的 概念 是 不 是 也 具有 类 似 的 
特点 ? 如 有 果 能 形象 化 地 表示 出 来 ， 也 许 就 可 以 和 人 的 概念 中 的 脸 作 一 比较 了 。 
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图 7-6 各 国平 均 人 脸 ” 


dd 图 片 来 自 Mike Mike 的 “Face of Tomorrow” 项 目 。 
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最 后 ， 我 还 有 两 个 问题 想 和 大 家 交流 一 个 ， 有 兴趣 的 研究 者 可 以 一 同 来 完成 。 


一 个 问题 是 计算 机 智能 的 评价 指标 。 这 个 问题 来 日 于 我 所 从 事 的 人 的 认 知 能 力 评 
价 。 如 末 有 类 似 的 办 法 能 够 评价 人 工 智 能 的 智能 化 水 平 , 科学 评测 感 芭 、 辨 别 、 存 储 、 
提取 等 过 程 的 综合 能 力 ， 而 不 仅仅 是 考察 运算 速度 ， 将 更 有 助 于 人 工 智能 的 发 展 。 在 
这 个 问题 上 ， 人 类 认 知 能 力 评价 的 思想 方法 可 能 起 到 一 定 的 作用 。 不 过 我 们 月 然 无 法 
给 计算 机 做 问卷 ， 如 何 把 给 人 做 的 题目 转化 为 计算 机 能 够 计算 的 任务 是 一 个 突破 。 


目前 ,一 个 可 行 的 方案 是 利用 容易 引起 机 涡 学 习 算法 或 者 人 的 识别 机 制 出 现 错误 
的 视觉 图 片 ( 见 图 7-7 和 图 7-8 ), 也 许 这 类 网 瞩 可 以 用 来 测试 计算 机 算法 的 智力 水 平 。 


7-7 这 是 人 脸 还 是 树木 ? 检验 计算 机 如 何 处 理 模 核 7-8 计算 机 能 识别 出 来 几 张 脸 ? 也 许 是 检验 
两 可 的 信息 模拟 人 脑 效 果 的 试金石 


为 一 个 问题 是 深度 学 习 不 同 层级 对 应 的 功能 的 测量 。 这 仍然 是 站 在 认 知 科学 的 角 
度 来 看 计算 机 算法 受到 的 启发 。 很 多 人 介绍 深度 学 习 时 都 会 提 到 不 同 层 的 信息 从 简单 
到 抽象 的 过 程 ， 如 果 能 利用 心理 学 实验 设计 的 思路 把 机 带 学 习 算法 的 不 同步 又 当 作 人 
脑 的 不 同 皮 层 模 块 研究 ,也许 有 助 于 搞 清 楚 哪 些 层 次 提取 的 是 低 水 平 感 知 信息 ， 哪些 
层级 提取 的 是 语义 信息 ,也 有 助 于 理解 深度 学 习 中 抽象 的 语义 信息 是 如 何 形 成 的 以 及 
如 何 改进 ， 而 这 些 对 于 路 通路 的 计算 具有 重要 意义 。 
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集 智 俱乐部 是 一 些 科 研 理 想 主 义 者 从 事 “ 业 余 ” 研 究 的 集体 。 不 是 每 个 人 都 有 条 
件 或 者 有 必要 去 科研 机 构 从 事 专业 的 人 研究， 但 是 无 论 在 哪里 做 人 研究 ,一定 要 有 科学 的 
方法 ,具备 科学 的 知识 体系 。 从 这 个 角度 讲 ， 我 仅仅 推荐 以 下 两 本 著作 。 
Q Marr. Vision: A Computational Investigation into the Human Representation and 
Processing of Visual Information, The MIT Press, 2010 
口 认 兆 平 . Understanding Vision Theory, Models, and Data, Oxford University Press, 
2014 


Marr 的 闭 作 是 非常 经典 的 ， 局 发 了 整整 一 代 人 ， 可 异 他 过 早 地 离开 了 这 个 领域 ， 
否则 我 们 今天 面临 的 也 许 是 妨 一 个 世界 。 李 兆 平 老师 是 非常 著名 的 华人 科学 家 ,我 
经 在 多 个 场合 了 解 她 的 理论 ， 李 老师 的 著作 很 值得 一 谈 。 为 外 ， 专 业 的 学 术 兰 作 ( 包 
括 科学 文献 ) 与 科普 读物 是 有 本 质 差 别 的， 需要 补充 大 量 专业 知识 ,不 能 抱 着 实用 的 
目的 去 寻找 谷 案 ， 那 样 娩 怕 会 失望。 

如 采 大 家 对 视觉 科学 研究 有 兴趣 , 那么 中 国 科 学 院 生 物 物理 研究 所 陈 宁 院 士 、 北 
京 大 学 心理 学 系 方 方 老师 、 北 京师 范 大 学 刘 吉 老师 和 李 武 老师 的 网 站 、 讲 座 和 论文 也 
是 不 容错 过 的 ， 最 起 码 值得 了 解 一 下 专业 研究 机 构 里 从 事 什么 研究 题目 。 

如 条 大 家 仅仅 是 对 视觉 感 兴趣 ， 而 不 想 从 事 俩 究 ， 那 么 视觉 科普 网 站 The Joy of 
Visual Perception ( http:/www.yorku.ca/eye/toc.htm ) 也 值得 看 一 下 ,都 是 用 浅显 的 文字 
和 实例 讲述 视觉 科学 的 道理 ， 这 些 内 容 可 能 启发 性 更 强 。 

如 果 大 家 对 认 知 神经 科学 感 兴趣 ， 可 以 系统 阅读 《 认 知 神经 科学 : 关于 心智 的 生 
物 学 》( Coegnitive Neuroscience: The Biology of the Mind ) 和 《神经 科学 探索 脑 (第 2 
版 )》( Neuroscience: Exploring the Brain, 2nd Edition )。 相信 大 体 看 完 视觉 部 分 以 后 ， 
骨 阅 读 其 他 理论 文献 就 不 那么 困难 了 。 

对 于 想 从 事 认 知 计算 、 把 人 脑 和 计算 机 融合 在 一 起 的 研究 者 ,推荐 阅读 老 前 者 罗 
四 维 老师 的 着 作 《 视 党 信息 认 知 计算 理论 》( 2010， 科学 出 版 社 )， 也许 罗 老师 很 久 以 
前 与 我 们 有 一 样 的 想法 ,他 已 经 做 完 的 事 是 十 分 值得 我 们 深入 学 习 的 。 
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2014 年 6 月 份 我 收 到 集 乔 俱乐部 的 邀请 ， 建 议 根 据 2013 年 专题 报告 的 
内 容 ， 给 大 家 介绍 一 下 人 的 智能 和 人 工 智 能 。 我 是 搞 交 又 学 科研 究 的 ， 实 际 
上 这 两 个 领域 都 不 算 精通 , 但 是 借鉴 其 中 一 个 的 思想 方法 来 理解 另 一 个 使 我 
受到 很 多 启发 。 借 此 机 会 , 我 把 我 在 集 智 的 两 个 报告 的 核心 内 容 介 绍 给 大 家 ， 
力争 引导 大 家 理解 清楚 几 个 问题 (实际 上 很 可 能 有 更 多 问题 不 理解 )， 让 大 
家 对 这 两 个 问题 之 间 的 关系 有 一 个 了 解 。 要 了 解 两 个 问题 本 身 ,， 需要 阅读 认 
知 科 学 和 计算 机 科学 专业 著作 。 

多 年 来 我 一 直 在 考虑 计算 的 问题 , 对 计算 机 的 客体 信息 表达 方式 和 提取 
方法 都 有 深 深 的 疑惑 ， 对 很 多 算法 起 作用 的 机 制 不 理解 ， 尝 试 类 比 人 的 处 理 
加 工 过 程 。 先 后 有 机 会 听 了 浙江 大 学 唐 孝 威 院士 和 中 国 科 学 院 生 物 物理 所 陈 
和 霖 院士 两 位 老 先生 的 讲座 ， 他 们 的 研究 深 深 吸引 了 我 。 对 于 他 们 提出 的 很 多 
问题 ， 当 时 我 感到 也 许 是 解决 很 多 信息 科学 问题 的 出 路 ， 大 尺度 的 拓扑 结构 
优先 这 一 观点 非常 吸引 我 。 这 更 坚定 了 我 从 事 认 知 科学 研究 的 决心 。 后 来 ， 
我 真 的 走 进 了 认 知 科学 研究 领域 , 人 对 复杂 视听 觉 信 息 加 工 的 机 制 始 终 是 我 
关注 的 问题 ， 我 期 待 着 能 从 中 找到 一 些 对 计算 有 帮助 的 结构 和 功能 上 可 借鉴 
的 优势 。 这 种 朴素 的 想法 可 能 是 集 智 俱乐部 所 有 成 员 共 同 的 目标 ， 也 正 是 这 
个 目标 促使 大 家 走 到 一 起 。 

实际 上 ， 认 知 科 学 理论 研究 和 实际 问题 还 是 有 一 些 问题 的 ， 带 着 工程 应 
用 的 目的 来 看 理论 问题 ， 难 以 直接 发 现 其 价值 。 有 些 问 题 在 理论 上 有 意义 ， 
但 是 如 果 已 经 有 人 证 明 或 者 提供 证 据 ， 再 做 同样 的 研究 ， 意 义 会 马上 大 打折 
扣 ,， 没有 研究 者 愿意 花 时 间 简 单 验证 已 有 的 结论 。 有 些 问 题 虽然 在 理论 上 意 
义 不 大 ,但 是 在 实践 应 用 中 可 能 是 一 个 很 有 价值 的 计算 指标 ， 首 通 理论 研究 
者 往往 不 关注 这 种 “ 边 角 余 料 ”， 除 非 某 位 大 和 牛 心 血 来 潮 挖 出 来 一 个 很 久 以 
前 的 坑 ， 在 Science 发 了 一 篇 论文 。 这 种 情节 从 我 进入 北 师 大 开始 ， 几 乎 每 
天 都 在 发 生 ， 我 也 时 刻 生 活 在 两 个 学 科 激 烈 的 冲突 中 。 一 方面 ， 我 认为 我 是 
一 个 工科 男 , 应 该 提炼 出 来 一 些 有 应 用 价值 的 指标 或 算法 ,至 少 是 计算 模型 ， 
这 些 都 是 信息 科学 最 核心 的 部 分 ; 另 一 方面 ， 认 知 科 学 的 研究 工作 要 求 我 必 
页 按理 论 学 科 的 规律 办 事 ， 设 计 实 验 ， 解释 结果 ， 往 一 个 大 的 理论 假说 方面 
近 ， 试 图 支持 、 补 充 或 者 反 驱 已 有 的 观点 ， 这 些 都 是 工作 中 最 有 价值 的 部 
， 反 倒是 这 一 学 科普 遍 将 数据 处 理 看 作 低 水 平 技术 活 。 现 在 我 已 经 不 纠结 


~ 
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这 个 问题 了 ,从 事 交 又 学 科研 究 必 须 了 解 清 楚 各 个 学 科 的 语言 ， 不 能 简单 照 
搬 ， 要 站 定 一 个 学 科 ， 同 时 真 的 理解 另 一 个 ， 这 样 才 能 起 化 学 反应 ， 促 进 融 
会 员 通 ， 用 一 个 学 科 的 优势 解决 另 一 个 学 科 的 问题 ， 这 是 做 好 交叉 学 科研 究 
最 值得 注意 的 。 

考虑 到 本 书 是 一 本 科普 读物 ， 我 尽量 提炼 出 最 核心 的 观点 ， 并 用 通俗 易 
懂 的 语言 来 阐述 ， 避 免 写 成 一 篇 学 术 论 文 。 为 了 尽 可 能 不 犯 大 的 错误 ， 我 查 
阅 了 很 多 文献 和 网 上 计算 机 科学 工作 者 的 科普 文章 。 时 间 有 限 ， 没 有 一 一 列 
出 ， 十 分 抱歉 ， 在 这 里 一 并 致谢 。 
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张江 


图 8-1 这 幅 图 画 的 是 什么 ?是 一 个 局 脚 杯 还 是 两 个 相对 的 人 脸 ? 其 实 这 两 个 答案 
邦 正 确 ， 它 取决 于 你 把 什么 当 作 前 景 ,把 什么 当 作 衬 捷 。 在 中 实 志 界 中 ， 图 形 与 讨 克 
已 是 相伴 而 生 、 相 互 转换 的 。 


8-1 图形 和 衬 底 
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机 各 与 人 之 间 的 关系 就 好 比 图 形 与 守 压 。 人 类 通过 发 展 人 工 和 食 能 而 勾勒 出 前 景 
形 ， 与 此 同时 ， 人 类 使 用 机 带 的 方式 也 在 悄然 变化 ， 这 便 是 诗 研 。 前 景 与 图 形 相伴 而 
生 ， 谁 也 离 不 开 谁 。 虽 然 人 类 发 明了 智能 机 带 ， 但 是 单个 人 无 力 阻 止 人 工 智 能 的 进 一 
步 发 展 。 而 机 人知 同样 需要 人 类 来 不 断 改 造 目 己 的 算法 ,从 而 实现 比 生 物 更 加 快速 的 进 
化 。 在 机 各 服务 于 人 类 的 同时 ， 人 类 社会 正在 接受 机 人们 史无前例 的 改造 : 那些 无 法 
跟 上 机 笑 进 化 步伐 的 人 将 被 整个 社会 所 边 绿 化 。 就 这 样 ， 图 形 与 背景 水 乳 交 融 般 地 协 
同 演化 着。 


经 典 的 人 工 智 能 学 科 将 过 多 的 精力 集中 在 了 人 机 图 画 的 前 景 。 科 学 家 们 对 如 何 改 
造 机 带 算 法 ,实现 一 个 又 一 个 拟人 的 智能 而 乐 此 不 疫 ,， 却 或 多 或 少 地 忽略 了 背景 一 一 
那些 从 在 屏 龙 前 敲 击 键盘 的 人 。 事 实 上 ， 人 对 于 人 工 智能 来 说 不 仪 不 可 或 号 ,而 且 至 
关 重 要 。 这 可 以 体现 在 两 个 方面 : (1) 人 创造 了 人 工 智能 算法 一 一 迄今 为 止 ， 能 够 完 
全 和 凭空 创造 智能 算法 的 程序 或 机 融 仍 然 不 存在 ; (2) 人 工 千 能 算法 的 最 终 服务 对 象 始 
终 是 人 类 。 尺 管 按 照 很 多 额 博 朋克 小 说 的 说 法 ， 机 器 很 有 可 能 在 一 个 数学 世界 中 创造 
出 属于 机 需 目 己 的 、 人 类 无 法 理解 的 智能 ， 但 是 这 些 程序 在 现实 中 是 不 可 能 出 现 的 。 
因为 即使 出 现 了 ,我 们 也 无 法 确切 地 感知 到 。 讨 论 一 个 完全 独立 于 人 类 理解 能 力 的 智 
能 世界 是 坚 无 意义 的 。 

所 以 ， 人 工 千 能 程序 从 一 开始 就 和 它 的 背景 一 一 人 一 一 天 然 地 和 砖 合 在 了 一 起 , 我 
们 要 发 展 人 工 入 能 是 不 可 能 将 人 类 所 起 到 的 作用 完全 忽视 的 。 这 篇 文 草 就 从 人 机 交互 
的 角度 重新 审视 人 工 乔 能 。 首 和 完 ， 如 来 我 们 站 在 一 个 足够 高 的 人 机 互动 的 视角 来 看 ， 
那么 人 工 智 能 程序 应 该 是 一 个 能 够 让 人 类 完全 融和 其中, 并 能 够 通过 人 类 的 交互 而 不 
基 目 我 进化 的 平台 。 其 次 ， 本 文 将 重点 绽 述 一 个 新 兴 的 领域 一 -人 类 计算 〈human 
computation )， 我 们 将 其 称 为 “人 工 ” 人 工 智能 。 我 们 将 看 到 ， 已 经 有 很 多 有 趣 的 人 
机 交互 系统 开发 出 来 ,它们 都 巧妙 地 将 人 和 机 顺 整 体 利 用 起 来 ， 完 成 了 传统 人 工 智能 
很 难 解 决 的 问题 。 最 后 ， 我 们 将 目光 集中 在 人 类 计算 中 最 关键 的 因素 : 注意 力 之 流 上 
面 。 我 们 将 指出 ， 如 何 精 确 地 利用 人 类 的 注意 力 之 流 是 解决 “人 类 计算 ”问题 的 关键 。 


从 图 灵 测 试 谈 起 


图 灵 测 试 是 目前 人 们 普 过 认可 的 判断 一 台 机 融 是 否 具 有 智能 的 好 方法 。 如 图 8-2 
所 示 ， 将 一 台 安 装着 智能 算法 的 计算 机 和 男 外 一 个 被 测试 的 人 分 别 关 进 两 个 小 黑 屋 
中 ， 另 外 一 个 人 类 测试 者 只 能 通过 键盘 和 屏幕 来 与 这 两 个 屋子 中 的 主体 进行 通信 。 如 
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末 测 试 者 在 足够 长 的 时 间 内 无 法 判断 出 哪 一 个 屋子 里 面 关 的 是 人 ， 哪 一 个 是 机 丛 ， 那 
么 我 们 就 次 该 机 融通 过 了 图 灵 测 试 ， 从 而 具有 了 智能 。 


人 计算 机 


0 


> 


图 8-2 图 灵 测 试 示意 图 


在 这 样 的 测试 中 ， 人 们 往往 将 注意 力 集中 在 那 台 机 和 奋 上 面 : 我 们 如 何 改 进 机 右 的 
算法 来 演 骄 人 类 。 但 实际 上 , 起 到 关键 作用 的 恰恰 不 是 机 各 而 是 测试 机 如 的 测试 者 
一 个 活生生 的 人 ， 因 为 他 是 最 终 的 判断 者 。 因 此 ， 与 其 说 我 们 要 开发 一 个 具有 稼 能 的 
机 和 佑 ,不 如 说 我 们 要 开发 一 个 能 够 让 人 类 测试 者 认为 具备 智能 的 机 恬 。 虽 然后 面 一 种 
说 法 只 比 前 面 的 说 法 多 出 了 一 个 限定 词 :“ 人 类 测试 者 认为 "， 但 是 ， 这 已 经 道破 了 
关于 人 工 智 能 的 一 条 真理 : 智能 不 是 一 个 可 以 客观 定义 的 属性 ， 而 是 一 种 依赖 于 观察 
者 一 一 人 类 测试 者 一 一 的 属性 。 


一 台 机 器 两 个 人 


下 面 ， 让 我 们 从 人 机 交互 的 角度 来 重新 审视 人 与 计算 机 程序 之 间 的 关系 。 对 于 一 
段 程序 来 说 ， 最 重要 的 有 两 个 人 (准确 地 说 ， 是 两 类 人 )， 他 们 分 别 是 : 程序 构建 者 
(程序 员 ) 和 使 用 者 ( 玩家 )， 如 图 8-3 所 示 。 


程序 员 编 写 了 这 个 人 工 智 能 程序 ,并 且 还 能 在 恰当 的 时 刻 修 改 该 程序 。 而 玩家 则 
是 纯粹 的 使 用 者 ， 虽 然 很 有 可 能 玩家 会 向 程 序 员 反馈 信息 ,告诉 他 (她 ) 这 个 人 工 智 
能 程序 会 有 什么 bug, 但 是 最 终 直 接 改 变 人 工 智能 程序 的 人 只 能 是 程序 员 而 不 是 玩家 。 
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图 8-3 ”一 个 程序 和 两 个 人 


当 我 们 按照 程序 员 和 玩家 的 角色 划分 了 人 的 时 候 , 其 实 已 经 暗合 了 一 种 程序 与 人 
的 交互 时 间 顺 序 在 里 面 : 即 程序 员 匈 要 编写 人 工 智能 程 上 然后 再 由 玩家 来 玩 。 之 后 ， 
程序 员 可 以 进一步 根据 玩家 的 反馈 修改 该 程序 ， 使 得 它 能 够 进一步 满足 玩家 的 需要 ， 
如 此 无 限 地 循环 下 去 …… 于 是 , 我 们 可 以 将 一 个 人 工 智 能 程序 本 人 交互 的 生命 周期 概 
括 成 图 8-4 所 示 的 循环 。 


使 用 / 玩 


图 8-4 完整 程序 周期 


更 有 意思 的 是 ， 当 我 们 判断 某 个 程序 比如 说 了 是 否 具有 智能 的 时 候 ， 其 实 上 暗含 了 
一 个 前 担 ， 这 就 是 P 是 在 使 用 / 玩 这 个 阶段 接受 测试 的 ， 而 不 能 包含 另外 的 开发 /调试 
阶 段 ， 否则 就 会 很 欧 唐 。 


比如 我 开发 了 一 个 程序 P， 它 只 会 运算 1+1， 但 我 却 号 称 它 具 有 了 人 工 智能 。 如 
采 你 是 它 的 玩家 ， 会 马上 大 呼 上 当 ， 说 这 个 程序 连 x+ty 都 计算 不 了 ， 怎 么 算得 上 是 人 
工 智能 呢 ? 这 个 时 候 ， 我 听 到 了 你 的 抱怨 ， 马 上 把 这 段 代 码 加 入 到 了 程序 P 中 ， 于 是 
它 可 以 计算 x+ty 了 ， 再 交 给 你 使 用 ， 并 解释 说 ， 我 没有 骗 你 ， 它 真 的 很 智能 ! 估计 你 
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无 语 了 。 

也 就 是 说 ， 如 末 程 序 P 具 有 了 智能 ， 那 么 显然 了 需要 独立 运行 ， 这 个 时 候 , 它 的 
创造 者 一 一 程序 员 不 能 对 程序 进行 改进 。 否则, 我 们 就 不 能 说 这 是 计算 机 程序 的 智能 ， 
而 是 程序 员 的 智能 了 。 于 是 ， 这 样 一 种 将 开发 /调试 阶段 和 使 用 / 玩 阶 段 做 出 非常 严格 
的 区 分 是 一 种 在 人 工 智 能 中 不 言 上 月 明 的 前 担 ,， 但 是 我 们 马上 将 会 看 到 ， 其 实 这 个 前 提 
是 完全 可 以 被 模糊 挥 的 。 


当 玩 家 变 成 程序 员 


下 面 让 我 们 再 从 计算 机 程序 的 角度 来 理解 人 与 机 大 的 交互 。 对 于 程序 来 说 ,无 论 
是 玩家 玩 这 个 程序 ， 还 是 程序 员 更 改 它 ， 其 实 都 体现 为 键盘 或 者 鼠标 上 面 输入 的 电信 
号 。 也 就 是 说 ， 其 实 计算 机 程序 从 来 都 不 区 分 玩家 和 程序 员 ， 这 种 区 分 恰恰 是 我 们 人 
类 做 出 来 的 。 

那么 ,我 们 就 来 做 这 样 一 个 假设 ,既然 玩家 和 程序 员 本 质 上 没有 任何 区 别 ， 那 有 
没有 可 能 玩家 就 是 程序 员 本 吴 呢 ? 这 样 ， 图 8-3 就 可 以 变 成 图 8-5。 


8-5 化 简 的 人 与 程序 的 关系 


这 里 的 玩家 就 是 一 种 广义 的 玩家 , 他 既是 普通 意义 上 的 玩家 (程序 的 使 用 者 ), 又 
是 普通 意义 上 的 程序 员 (程序 的 构建 者 或 修改 者 )。 进一步 ， 从 时 间 上 来 看 ,我 们 也 就 
不 再 区 分 开发 /调试 与 使 用 / 玩 这 两 个 不 同 的 步骤 了 ， 于 是 图 8-4 就 变 成 了 图 8-6。 
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8-6 ”化 简 的 程序 与 人 的 交互 周期 


因此 ， 所 有 的 互动 过 程 部 简化 为 7 一个“ 玩 ” 字 。 从 这 个 角度 来 说 ,传统 意义 上 
的 人 工 智 能 的 界定 已 经 沪 然 无 存 了 , 因为 我 们 已 经 不 能 分 割 出 来 一 个 能 够 独立 地 脱离 
编程 员 设 计 的 人 工 贸 能 程序 。 取 而 代 之 的 是 ,我 们 应 该 考虑 如 何 设 计 一 个 更 好 的 平台 
作为 初始 的 系统 ， 使 得 人 能 够 一 直 不 俘 地 在 这 个 平台 上 “ 玩 ” 下 去 。 这 才 是 从 图 形 和 
人 讨 底 这 两 个 角度 全 面 考虑 的 人 工 知 能 。 


让 我 们 还 是 以 图 灵 测 试 为 例 来 说 明 。 我 们 要 设计 的 其 实 不 是 一 个 多 么 强大 、 多 么 
聪明 的 聊天 程序 ， 而 是 一 个 可 以 提供 人 和 计算 机 进行 交互 的 平台 。 在 这 个 平台 之 中 ， 
玩家 随 随 便便 聊天 的 话语 ， 比 如 “你 吃 了 吗 ?” 与 程序 员 所 写 的 冷冰冰 的 机 器 代码 
“Mov2b,Addc, ”没有 本 质 上 的 区 别 。 这 样 ， 玩 家 普通 的 聊天 也 可 以 变 成 对 程序 指 
令 的 修改 ， 使 得 这 个 程序 能 够 在 聊天 使 用 中 完成 自身 结构 的 改变 ， 这 才 是 史上 最 强大 
的 人 工 乔 能 程序 。 


但 是 ， 如 有 果 读 者 稍 懂 一 些 计 算 机 原理 就 会 发 现 ， 运 行 中 输入 的 数据 与 程序 的 源 代 
码 其 实 是 不 能 如 此 等 同 的 ， 这 是 因为 对 于 程序 来 说 ， 这 两 套数 据 实际 上 是 处 于 不 同 的 
层次 之 上 的 。 运行 中 输入 的 数据 传递 给 了 程序 的 “软件 层 ”， 而 该 程序 的 源 代码 相当 于 
该 程序 的 “人 硬件 ” ， 它 在 运行 起 来 以 后 就 不 能 修改 了 。 这 似乎 是 一 个 不 能 逾越 的 障 得。 

然而 ， 其 实 图 灵 早 已 经 帮 有 我 们 解决 了 这 个 问题 。 因 为 ， 图 灵 发 明了 所 谓 的 通用 图 
灵机 (Universal Turing Machine， 参 见 本 书 第 2 草 )。 通 用 图 灵机 好 比 是 一 个 空空 的 平 
台 ， 它 不 必 实 现任 何 具体 的 计算 任务 ， 但 却 可 以 模拟 任意 一 台 图 灵机 的 运作 。 于 是 ， 
当 你 想 让 通用 图 灵机 实现 某 一 种 计算 ， 例 如 x+ty 的 时 候 ， 你 只 要 把 相应 的 编码 输入 给 
它 就 可 以 了 。 这 样 ， 对 于 通用 网 灵机 来 说 ， 运 行 中 输入 的 数据 的 确 与 修改 程序 的 指令 
是 等 价 的 。 

所 以 ,通用 图 灵机 其 实 就 是 一 个 了 不 起 的 人 工 智能 平台 。 从 这 个 意义 上 来 说 ， 其 
实 我 们 不 应 该 发 明 什 么 人 工 智 能 程序 ， 而 应 该 发 现 人 工 智 能 ! 
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匀 胜 前 进 


然而 ， 通 用 图 灵机 显然 做 得 不 够 好 。 和 否则 ,我 们 也 没有 必要 再 去 发 展 人 工 智能 这 
个 学 科 了 。 其 中 的 原因 也 很 简单 ， 通 用 图 灵机 需要 有 一 套 特 定 的 编码 才能 够 把 输入 的 
符号 转变 成 有 效 的 程序 。 而 这 一 套 编码 显然 不 是 给 玩家 设计 的 。 所 以 ,我 们 将 一 般 的 
交互 ( 玩 ) 交 给 了 玩家 ， 而 把 特殊 的 改进 程序 的 交互 ( 编程 ) 交 给 了 程序 员 。 于 是 ， 
程序 员 和 玩家 的 区 分 、 开 发 /调试 和 使 用 / 玩 的 区 分 出 现 了 。 

如 果 看 清楚 了 这 一 点 ,我 们 就 不 难 明 确 我 们 要 改进 的 方向 了 。 我 们 最 需要 做 的 实 
际 上 是 要 让 编程 与 玩 之 间 的 区 分 变 得 越 来 越 模 糊 。 那 么 ， 对 于 程序 来 说 ， 它 应 该 逐渐 
进化 成 越 来 越 友 好 的 形式 ;而 对 于 人 来 说 ， 它 应 该 越 来 越 熟悉 机 融 的 秉性 ， 知 道 如 何 
与 机 器 打交道 。 这 样 ， 人 和 机 器 才能 耦合 在 一 起 完成 协同 的 进化 。 这 种 协同 进化 的 前 
提 是 要 让 计算 机 程序 充分 地 利用 起 交互 这 种 资源 。 我 们 可 以 把 人 工 智能 程序 比喻 成 一 
种 吃 交 互 的 机 器 ， 如 图 8-7 所 示 。 


MN 
' < 


人 


8-7” 乃 交互 的 程序 


为 , 只 有 玩家 的 交互 输入 才 是 让 机 器 实现 自我 改进 、 实 现 进化 的 唯一 动力 来 源 。 


盲目 的 钟表 匠 


也 许 ， 上 面 的 论述 看 起 来 非常 抽象 ,但 是 将 玩家 的 交互 ( 玩 ) 视 作 一 种 资源 从 而 
指引 程序 的 进化 实际 上 并 不 是 空穴来风 。 人 们 已 经 开发 出 很 多 这 样 的 程序 了 ， 而 且 还 
形成 了 一 个 新 兴 领 域 ， 叫 作 交 互 式 进化 计算 〈Interactive evolutionary computing )。 

最 早 的 交互 式 进 化 可 以 追溯 到 一 个 叫 作 “生物 变形 ”( Biomorph ) 的 程序 。 理 查 
德 : 道 金 斯 (Richard Dawkins ) 是 一 位 著名 的 生物 学 家 , 他 在 1986 年 出 版 的 著作 《 讶 
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眼 的 钟表 匠 》 一 书 中 提 到 了 一 个 这 样 的 程序 ， 以 展示 生物 进化 的 原理 。 


一 群 由 简单 编码 构成 的 数字 生物 形态 被 绘制 在 屏蔽 上 ( 如 图 8-8 所 示 ), 玩家 通过 
鼠标 点 选 其 中 一 个 看 起 来 比较 “顺眼 ”的 数字 生物 ， 于 是 该 程序 就 会 按照 遗传 算法 的 
方法 以 该 程序 为 母 代 进行 模拟 楷 殖 : 将 该 数字 生物 的 基因 串 复 制 奋 干 份 , 并 且 在 每 一 
次 复制 的 过 程 中 都 会 以 一 定 的 概率 发 生变 异 。 新 产生 的 子 代 会 答 换 邱 原 来 屏 荐 上 的 所 
有 生物 形态 ， 展 现在 玩家 的 面前 ， 于 是 玩家 再 进一步 选择 ……' 图 8-9 展示 了 一 个 被 玩 
家 选择 出 来 的 生物 形态 的 进化 轨迹 。 


8-8 屏幕 上 的 数字 生物 形态 


8-9 一 次 点 选 的 轨迹 
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在 该 程序 中 , 玩家 扮 涛 了 上 第 的 角色 , 它 会 对 随机 生成 的 数字 生物 形态 进行 选择 。 
于 是 ,在 玩家 一 系列 的 鼠标 点 选 操作 下 ， 效 字 生 物 形态 开始 不 断 地 改进 目 号 ， 从 而 起 
来 越 符 合 玩家 的 “审美 ”标准 。 

这 是 一 个 典型 的 将 使 用 / 玩 和 开发 /调试 混 消 在 一 起 的 例子 。 该 程序 之 所 以 可 以 把 
玩 转变 成 计算 机 代码 应 完全 归功 于 遗传 算法 。 该 算法 可 以 通过 随机 变异 生成 一 系列 候 
选 代 码 ， 并 通过 玩家 选择 的 作用 过 滤 反 那些 无 效 的 变异 代码 ， 从 而 导致 新 的 符合 玩家 
“审美 ”的 代码 一 点 点 进化 出 来 。 


这 样 一 种 有 效 地 让 用 户 “编程 ”的 模式 很 快 被 人 们 用 来 解决 一 些 更 有 意义 的 实际 
问题 。 例 如 ， 关 国 新 墨西哥 州立 大 学 的 约 随 期 顿 〈《Victor S. Johnston ) 教授 在 他 的 敌 
作 《 人 情感 之 源 》 一 书 中 就 撒 述 了 这 样 一 个 人 类 面孔 生成 的 程序 。 首 乞 ， 他 把 人 脸 的 各 
个 组 成 部 分 ， 如 蜡 子 的 形状 、 眼 睛 的 大 小 、 有 额头 的 宽度 等 按照 它们 的 特征 进行 编码 。 
之 后 , 与 “生物 变形 ”程序 一 样 ， 计 算 机 在 随机 地 选择 一 组 参数 之 后 就 能 在 屏幕 上 生 
成 一 系列 人 腔 ， 并 让 人 进行 选择 。 但 是 , 与 “生物 变形 ”不 同 的 是 ， 这 个 人 脸 选 择 软 
件 可 以 用 于 解决 实际 问题 ， 而 不 仅仅 是 为 了 娱乐 。 约 聊 期 顿 教 授 将 这 和 软件 用 于 辅助 
目击 者 寻找 杀人 凡 手 。 人 们 通 肖 不 知道 如 何 描述 罪犯 的 面部 特征 , 但 却 可 以 轻松 地 识 
别 出 哪 一 张 脸 更 像 区 手 。 于 是 ， 只 要 杀人 和 案 目 击 者 在 电脑 屏 硕 前 不 集 地 点 选 那 些 更 像 
徘 犯 的 腔 孔 ， 就 会 一 点 点 地 把 真正 的 徘 犯 面 孔 “ 进 化 ”出 来 。 

目前 ， 这 种 交互 式 进化 计算 方法 已 经 演变 成 了 一 个 计算 机 科学 分 文 ,， 并 被 广泛 地 
应 用 在 了 图 形 图 像 处 理 、 语 言 和 声 首 处 理 、 工 业 和 艺术 设计 、 知 识 获 取 和 数据 挖掘 、 
教育 和 娱乐 等 领域 中 。 


人 类 计算 


如 采 说 上 述 单机 版 的 交互 式 进化 程序 还 是 过 于 简单 且 单一 的 话 , 那么 人 类 计算 则 
提供 了 更 加 多 样 化 的 人 机 协同 工作 模式 。 随 着 互联 网 的 出 现 ， 人 机 互动 也 逐渐 变 成 了 
分 布 式 的 ， 这 就 为 我 们 在 更 大 的 空间 中 创造 出 新 新 的 交互 方式 提供 了 可 能 。 

2008 年 9 月 ， 卡 内 基 梅 隆 大 学 的 青年 学 者 路 易 斯 : 汉 “' 安 在 著 名 的 Science 杂志 
上 发 表 了 一 篇 题 为 “reCAPTCHA: 通过 网 页 安全 测试 利用 人 进行 字符 识别 ”的 文章 ， 
并 给 出 了 一 个 具体 的 用 人 类 计算 解决 实际 问题 的 例子 ( 如 图 8-10 所 示 )。 
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The Norwich line steamboat train, from New- 
London for Boston, this ran off the track 
seven miles north of New-Londpn. 


morning 


Type the two words: Wy 
"1 (reCAPTCHA 
8 


图 8-10 reCAPTURE 程序 界面 (图 片 来 源 久 ) 


我 们 每 个 人 都 有 过 在 网 站 上 输入 验证 人 码 的 经 验 : 网 站 程序 为 了 过 小 挥 那些 讨 大 的 
扑 虫 程序 ， 就 会 生成 一 个 包括 模糊 不 清 、 扭 曲 变 形 的 映 文 字母 的 图 瞩 ， 让 你 将 正确 的 
字母 识别 出 来 , 从 而 让 程序 认为 你 是 一 个 真正 的 人 , 而 不 是 一 个 爬虫 程序 。 我 们 知道 ， 
人 类 的 模式 识别 能 力 远 远 高 于 人 工 智 能 程序 ,利用 这 一 点 ， 验 证 码 程序 就 可 以 有 效 地 
挡住 那些 可 亚 的 疏 虫 了 。 


那么 ,我 们 能 不 能 反 过 来 利用 人 类 的 这 种 能 力 ， 而 帮助 我 们 解决 实际 的 模式 识别 
问题 呢 ? 谷歌 公司 刚好 要 做 一 个 庞大 的 工程 ,就 是 把 大 量 的 英文 古文 献 数 字 化 放 到 网 
上 。 但 是 在 数 子 化 古文 献 的 过 程 中 ， 人 们 发 现 ， 有 很 多 字符 由 于 年 代 久 还 ,很 难 被 模 
式 识别 程序 正确 识别 ， 所以， 我 们 只 能 依 乔 人 来 完成 这 一 任务 。 但 是 ， 由 于 不 能 识别 
的 字符 非 疝 多 ， 如 采 雇 人 人 来 做 ， 既 需要 花费 大 量 的 时 间 和 人 金钱， 又 不 能 保证 识别 的 
正确 性 。 


于 是 冯 … 安 突 发 奇想 : 我 们 为 什么 不 把 这 些 未 识别 的 字符 混在 那些 验证 码 之 中 ， 
让 Internet 上 的 玩家 帮助 我 们 完成 字符 的 识别 呢 ?” 也 就 是 说 ， 我 们 可 以 用 古书 上 的 文 
字 替 换 那 些 程序 故意 生成 的 识别 验证 码 , 这样， 玩家 们 就 在 输入 验证 码 的 同时 帮助 我 
们 完成 了 文字 识别 工作 。 这 套 系 统 就 是 reCAPTURE。 


当然 ,为 了 保证 输入 的 正确 性 ， 冯 : 安 还 想 出 了 各 种 办 法 来 进行 校 验 ( 例如 同一 
个 字符 要 两 个 以 上 的 用 户 输入 完全 相同 的 内 容 之 后 才 存 储 到 数据 库 中 )。 因 此 ， 他 巧 
妙 地 利用 人 类 的 能 力 完成 了 由 单独 的 计算 机 程序 很 难 解决 的 问题 。 由 于 人 类 的 文字 识 
别 能 力 远 优 于 计算 机 算法 ， 所 以 结合 了 reCAPTURE 软件 以 后 的 文字 识别 精确 度 由 原 
来 的 83.5% 提 高 到 了 99.1%， 和 谷歌 可 以 以 每 天 160 本 书 的 速度 对 文字 识别 工作 进行 校 
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验 。 最 后 ， 冯 ， 安 在 文 草 中 总 结 到 :“ 被 浪费 的 ”人 类 人 处理 问题 的 能 力 可 以 被 利用 起 
来 以 解决 那些 计算 机 很 难 解决 的 问题 。 


reCAPTURE 的 成 功 促使 将 ' 安 进一步 提出 了 “人 类 计算 ”的 概念 ， 并 开发 出 了 
更 多 的 实际 例子 。 例如, 一 个 称 之 为 Verbosity 的 程序 可 以 让 玩家 在 游戏 中 为 计算 机 输 
入 格式 化 的 知识 。Verbosity 是 一 款 网 络 游戏 。 有 两 个 玩家 参与 ， 其 中 一 个 是 陈述 者 ， 
一 个 是 猜 题 者 。 在 每 一 次 游戏 中 ， 陈 述 者 的 界面 上 会 出 现 一 个 词语 〈 例 如 Laptop， 笔 
记 本 电脑 )， 陈 述 者 的 任务 是 尽量 使 用 一 系列 不 出 现 Laptop 的 词语 来 描述 这 个 词 ， 并 
将 这 些 描述 发 送 给 猜 题 者 。 例 如 ， 如 图 8-11 所 示 ， 当 陈述 者 界面 上 出 现 了 Laptop 这 
个 词 之 后 , 他 (她 ) 就 可 以 输入 It contains akeyboard ( 它 包含 一 个 键盘 ) 来 描述 Laptop 
并 发 送 给 猪 题 者 。 猿 题 者 最 终 根 据 陈 述 者 的 描述 猜测 这 个 词 是 什么 。 当 猿 题 者 猿 中 的 
时 候 ， 这 一 轮 游戏 结束 ， 两 个 玩家 都 获得 一 定 的 分 数 。 


8-11 ”Verbosity 的 运行 界面 (图片 来 源 呈 ) 


巧妙 的 是 ，Verbosity 利用 这 两 个 玩家 的 游戏 而 生成 了 一 个 庞大 的 知识 库 。 这 个 知 
识 库 存储 了 描述 不 同事 物 的 常识 知识 。 例 如 在 上 面 给 出 的 猜测 笔记 本 电脑 的 例子 中 ， 
陈述 者 的 叙述 “It contains a keyboard ”就 被 存 到 了 这 个 知识 库 中 ， 于 是 机 需 获 得 了 “ 笔 
记 本 电脑 包含 一 个 键盘 ”的 知识 。 要 知道 ， 如 何 模型 化 浓 识 数据 是 传统 人 工 智能 中 一 个 
非常 环 手 的 问题 , 原因 是 常识 知识 几乎 比比 丝 是 , 全 部 把 它们 量化 到 计算 中 几乎 是 不 可 
能 完成 的 任务 。 然 而 ， 通 过 游戏 的 方式 ， 况 安 巧 妙 地 让 人 类 玩家 完成 了 这 个 任务 。 
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Matchin 则 是 另外 一 款 双 人 玩 的 游戏 。 它 会 同时 在 两 个 玩家 的 屏幕 上 展示 两 张 图 
片 ， 并 要 求 玩家 选 出 一 张 “你 的 对 手 最 可 能 选择 的 图 片 "， 如 图 8-12 所 示 。 


' 
Th OFTE. 


8-12 ”Matchin 的 运行 界面 


由 于 每 个 人 都 要 猜测 对 手 的 喜好 ,所 以 最 保险 的 方式 就 是 选 那 张 自 己 认为 最 美的 
图 片 ， 因 为 “ 美 ”通常 是 人 们 共有 的 一 种 偏好 。 于 是 ，Matchin 程序 在 一 个 大 型 图 片 
库 中 随机 地 选择 两 两 图 片 的 配对 ， 让 玩家 玩 。 玩 家 不 断 地 选择 共同 喜好 的 图 片 ， 这 就 
相当 于 为 所 有 图 片 库 中 的 图 片 做 出 了 一 种 排序 ,渐渐 地 , 一些 图 片 得 到 了 较 高 的 得 分 ， 
并 且 这 些 图 片 通 常 是 那 种 符合 人 们 审美 的 图 ( 如 图 8-13 所 示 )。 


ELO True Skill 


8-13 ”Matchin 中 得 分 最 高 的 几 张 图 (图片 来 源 ) 
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看 玉 ， 通 过 这 种 简单 的 游戏 ， 我 们 已 经 教会 了 Matchin 这 个 计算 机 程序 什么 叫 作 
“类 "更 有 趣 的 是 ,系统 还 能 甄别 出 女性 玩家 和 男性 玩家 不 同 的 审美 倾 加 ,例如 图 8-14 
左 侧 的 两 幅 图 刻 是 由 女性 玩家 选择 出 来 的 ， 而 右 侧 的 两 幅 则 是 由 男性 玩家 选 出 来 的 。 


图 8-14 女性 用 户 选 出 来 的 几 张 得 分 最 高 的 图 〈 左 )， 男 性 用 户 选 出 来 的 得 分 最 高 的 图 
( 右 ) (图 片 来 源 ”) 


随 着 大 量 的 数字 图 片 被 传 到 网 1 如 何 对 这 些 图 片 进行 分 类 和 鉴别 变 成 了 一 个 计 
算 机 很 难 完成 的 艰巨 任务 。 于 是 ， 通 过 Matchin 这 个 游戏 ， 人 类 计算 可 以 起 到 很 大 的 
作用 。 


我 们 最 后 要 介绍 的 一 个 人 类 计算 系统 是 Duolingo, 它 可 以 通过 人 类 计算 的 方式 来 
日 动 翻 幸 互 联网 。Duolingo 是 一 个 非常 成 熟 的 在 线 外 语 学 习 系 统 ， 用 户 可 以 在 这 个 
有 一 门 外 语 。 在 学 习 的 过 程 中 ,除了 做 一 些 标准 的 练习 题 以 
外 ， 还 会 做 一 些 真 正 的 翻译 工作 : 系统 会 目 动 从 外 语 网 页 上 摘 下 来 一 些 句 子 让 用 户 翻 
详 。 所 有 这 些 练习 都 会 提升 用 户 在 整个 系统 中 的 经 验 值 。 通 过 这 种 方式 ， 用 户 既 学 习 
了 外 语 ， 同 时 又 帮助 翻译 了 了 网页， 可 谓 是 一 入 双 雕 。 


程序 的 引擎 一 一 人 类 的 注意 


当 我 们 领略 了 冯 … 安 的 人 类 计算 之 后 ， 


不 茶会 感 ee he dda 请 苋 
然 还 可 以 这 样 五 花 八 门 、 花 样 票 多 。 然 而 ， 在 这 些 纷 


党 复杂 的 具体 应 用 背后 究竟 隐藏 
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看 什么 普 适 性 的 原理 呢 ? 究竟 为 什么 玩家 的 “ 玩 ” 可 以 转化 成 一 种 机 和 硕 可 以 利用 的 资 
产 呢 ? 


人 的 注意 力 恰恰 是 其 中 最 关键 的 因 系 ! 当 我 们 “ 玩 ” 一 个 计算 机 程序 的 时 候 , 我 
们 实际 上 已 经 把 一 种 无 形 的 “能 量 ” 注 入 给 了 程序 ， 这 就 是 人 的 注意 力 。 


诺 贝尔 经 济 学 奖 得 主 邦 伯 特 : 西蒙 (Herbert Simon ) 早 在 1971 年 的 时 候 就 指出 : 
“在 一 个 信息 丰富 的 世界 中 ， 拥 有 信息 财 宣 就 意味 着 男 外 一 些 东 西 的 匮乏 : 所 有 那些 
言 息 所 消耗 的 东西 。 这 就 是 注意 力 。 因 此 ， 信 息 的 富足 必然 导致 注意 力 的 稀缺 ， 这 也 
就 使 得 如 何 能 够 在 过 载 的 信息 资源 上 面 有 效 地 分 配 注意 力 变 得 极其 重要 。 


随 着 互联 网 的 兴起 和 发 展 ， 我 们 正在 逐渐 步 入 西 宜 早 在 1971 年 就 预 谨 的 这 样 一 
个 信息 资源 极其 丰 讶 ， 而 注意 力 资源 相对 克 缺 的 时 代 。 因 此 ， 如 何 合理 而 巧妙 的 运用 
注意 力也 就 成 为 了 路 行 解决 的 问题 。 


在 著名 的 科幻 电影 《黑客 帝国 I》 中 有 这 样 一 段 场景 ， 如 岁 8-15 所 示 ， 叛 盏 的 首 
领 墨 菲 斯 描述 了 这 样 一 种 恐怖 的 未 来 : 最 终 有 一 天 ， 人 工 智 能 终于 苏醒 ,并 战胜 了 人 
类 ,。 它们 没有 把 人 类 赶 尽 杀 绝 ,而 是 在 所 有 人 的 大 脑 中 都 插入 接口 ， 让 他 们 醉生梦死 
于 一 个 巨大 的 Matrix 虚拟 世界 中 。 同 时 ， 人 类 的 生物 能 量 则 变 成 了 给 养 机 器 们 的 必需 
能 源 。 


8-15 《黑客 帝国 1》 中 的 场景 〈 墨 菲 斯 解释 说 ， 人 类 的 生物 能 被 转化 成 电池 维 
持 机 器 的 生存 ， 图 片 来 自 电 影 《黑客 帝国 1》) 


也 许 你 会 觉得 这 样 一 种 科幻 场景 未 倪 太 过 怒 怖 ,也 太 过 肥 远 。 但 是 实际 上 ， 对 于 
虚拟 世界 中 的 程序 来 说 ， 人 类 的 注意 力 的 确 就 像 能 量 流 一 样 滋养 了 这 些 程序 的 生存 。 


我 们 不 妨 把 机 融 的 内 存 环境 看 作 一 个 大 的 养 鱼池 , 内 存 中 活跃 的 程序 就 好 像 是 这 
个 池子 中 的 各 类 小 鱼 小 是 。 正 如 所 有 的 鱼 都 需要 吃食 物 一 样 ， 所 有 的 程序 体 都 需要 系 
统 给 它们 分 配 CPU 执行 时 间 。 在 目前 主流 的 多 任务 操作 系统 中 ， 只 有 苑 争 到 足够 多 
CPU 时 间 的 程序 段 才能 够 更 好 地 存活 ， 并 且 有 更 高 的 机 会 被 执行 和 修改 。 因 此 ，CPU 
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时 间 对 于 程序 体 就 像 是 能 量 流 对 于 鱼池 里 面 的 鱼 一 样 。 


然而 ， 计 算 机 系统 又 是 根据 什么 将 CPU 执行 时 间 分 配给 不 同 程序 段 的 呢 ? 这 很 
大 程度 上 是 由 电脑 前 的 人 决定 的 。 因 为 玩家 最 终 判 断 哪个 程序 好 玩 ， 哪 个 不 好 玩 ， 也 
就 决定 了 哪个 程序 会 被 激活 ， 哪 个 程序 要 被 马上 关 掉 。 于 是 ， 人 把 自己 的 注意 力 分 配 
给 计算 机 ， 计 算 机 再 将 这 些 注意 力 转化 成 CPU 时 间 (如 图 8-16 所 示 )， 然 后 CPU 时 
间 对 于 计算 机 程序 来 说 又 起 到 了 源源 不 断 的 能 量 流 的 作用 , 决定 了 大 大 小 小 程序 的 生 
生死 死 。 这 样 一 种 图 景 就 构成 了 整个 计算 机 环境 中 的 生态 循环 。 有 关 这 样 一 种 生态 学 
的 比喻 ， 大 家 可 以 进一步 阅读 本 书 第 9 草 。 


程序 


Oh oT] 


vA 本 
EN Ce | rn EI CIES 


和 
了 :> 能量” 程序 
党 = 
玩家 CPU 时 间 


8-16 ”注意 力 资源 转化 成 了 CPU 时 间 


玩 即 生产 


也 许 上 面 的 讨论 还 是 过 于 抽象 而 略 显 虚无 绿 缘 。 下 面 我 们 要 介绍 的 研究 则 
实在 了 很 多 。 因 为 世界 上 记 今 为 止 最 著名 的 虚拟 世界 经 济 学 家 爱德华 . 卡 斯 特 诺 瓦 
( Edward a 实 实在 在 地 计算 出 了 用 户 的 玩 能 ee 价值 量 是 多 少 ， 


早 在 2001 年 的 时 候 ， 爱 德 华 还 是 一 名 名 不 见 经 传 的 大 学 讲师 。 由 于 事业 上 受到 
本 一 些 挫折 ,他 开始 用 网 络 游戏 打发 无 聊 的 时 间 。 很 快 ， 他 便 沉浸 在 了 一 球 当 时 在 美 
Se 《无 尽 的 任务 》( Ever Quest，EQ ) 中 不 能 目 拔 。 然而, 受过 严 
格 的 经 济 学 科班 训练 的 他 很 快 跳出 了 无 意义 的 打 怪 升级 的 循环 , 开始 用 一 种 独到 的 经 
谤 学 家 的 眼光 来 审视 这 个 被 称 为 EQ 的 虚拟 世界 。 


在 这 个 世界 中 ， 玩 家 之 间 可 以 相互 交易 、 头 卖 装 备 ， 甚 至 可 以 倒卖 账号 。 更 有 意 
思 的 是 ， 有 些 人 还 将 目 己 的 猴 备 或 账号 拿 到 电子 商务 网 站 eBay ( 相当 于 中 国 的 淘宝 ) 
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上 去 拍卖 ， 并 获得 了 可 观 的 美元 收益 (如 图 8-17 所 示 )。 爱德华 很 快 敏锐 地 发 现 ， 这 
实际 上 就 是 出 口 贸易 ! 而 且 ， 一 个 玩家 在 虚拟 世界 中 等 级 越 高 ， 他 的 账号 就 能 卖 出 更 
高 的 价钱 。 这 也 就 意味 着， 玩家 在 EQ 世界 中 的 玩 实 际 上 是 一 种 实 实在 在 的 生产 一 一 
他 们 在 创造 价值 ， 这 是 实 实在 在 的 类 元 ! 


EQ 虚 拟 世界 玩家 


EQ 年 出 口 ，500 万 $ 


8-17 


接 下 来 , 爱德华 开始 发 挥 他 经 济 学 家 的 特长 。 首先 , 他 发 现 虚 拟 角 色 每 升级 一 次 ， 
玩家 就 可 以 在 eBay 上 多 卖 出 13 美元 。 其 次 ， 他 合算 出 玩家 让 自己 的 角色 升 一 级 大 概 
需要 51.4 小 时 ， 那 么 平均 每 个 小 时 每 个 玩家 就 能 创造 13/51.4 二 0.25 美元 的 价值 。 而 
且 , 每 天 EQ 游戏 中 都 有 60 381 个 玩家 在 线 , 那么 , 整个 游戏 在 一 年 内 创造 出 的 价值 ， 
也 就 是 GDP 年 均值 是 : 60 381 x 24 x 365 x 0.25 二 1 亿 3 千 万 美元 。 


这 是 一 个 可 观 的 数字 ， 因 为 按照 这 个 计算 ，EQ 作为 一 个 虚拟 的 国家 ，GDP 排名 
葛 然 是 2001 年 全 球 所 有 国家 的 第 77 位。 于 是 ， 爱 德 华 把 自己 的 这 些 研 究 总 结 成 一 篇 
文 草 《有 关 虚 拟 世 界 的 市 场 和 社会 的 第 一 手 账目 材料 》 发 到 了 网 上 。 他 的 文章 广 受 好 
评 , 读者 群 中 甚至 包含 一 些 诺 贝 尔 经 济 学 得 主 。 于 是 ， 爱 德 华 也 因为 这 篇 文章 而 声名 
大 品 ， 刁 价 倍增 。 

爱德华 的 研究 的 一 个 核心 假设 就 是 : 玩 即 生产 。 因 为 玩 消耗 了 注意 力 ， 而 注意 力 
相对 于 EQ 世界 来 说 就 是 一 种 资源 。 没 有 人 玩 的 网 络 游戏 必然 会 死 把。 所 以 ， 玩 家 看 
似 消 费 一 样 的 玩 的 行为 实际 上 构成 了 一 种 生产 ， 而 这 种 生产 的 价值 恰恰 可 以 体现 在 
eBay 上 虚拟 角色 的 拍卖 价格 上 面 。 
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谷歌 印 钞 机 


随 着 互联 网 的 普及 和 深入 ， 人 们 越 来 越 多 地 意识 到 : 注意 力 是 一 种 稀缺 资源 ， 
为 整个 互联 网 其 实 就 是 依靠 注意 力 资源 而 存在 的 。 既 然 注意 力 稀缺 ,那么 它 就 一 定 包 
含 厦 价 值 ， 于 是 一 门 称 为 “注意 力 经 济 学 ”的 学 科 诞 生 了 ， 并 送 助 人 们 赚 到 了 实 实在 
在 的 钱 。 而 最 大 的 最 家 恰恰 就 是 拥有 大 量 注意 力 流 量 的 互联 网 公司 谷歌 。 

互联 网 广告 的 运转 原理 就 是 将 人 类 的 注意 力 转 变 成 实 实 在 在 的 资金 流 。 而 谷歌 的 
巧妙 之 处 就 在 于 , 他 们 可 以 利用 人 工 智能 技术 精准 地 引导 这 种 注意 力 流动 和 相应 反问 
的 资金 流 。 合 歌 开 发 了 两 个 系统 ， 分 别称 为 AdWords 和 AdSense。 


首先 , 谷歌 公司 意识 到 每 天 成 千 上 万 的 网 民 给 谷歌 输入 了 大 量 的 关键 词 以 搜索 网 
页 ， 这 实际 上 有 是 一 种 商业 机 会 。 因 为 ， 如 采 将 这 些 天 键 词 作为 广告 去 出 售 ， 这 如 会 是 
一 大 笔 收 入 。 于 是 ，AdWords 系统 就 完成 了 这 一 任务 ， 它 将 搜索 关键 词 按照 重要 程度 
排序 ， 以 不 同 的 价格 出 售 给 广告 商 。 


其 次 ，AdSense 负责 将 正确 的 广告 投放 到 合适 的 网 站 上 。 它 根据 关键 词 ， 搜 索 到 
点 击 排名 靠 前 的 个 人 网 站 (博客 )， 并 从 这 些 网 站 站 长 或 博 主 那里 购买 广告 位 ， 然 后 
将 AdWords 中 的 大 量 广告 按照 关键 词 打包 投放 到 这 些 广告 位 上 。 由 于 采取 了 先进 的 人 
工 智 能 技术 ， 所 有 广告 的 投放 都 能 达到 精准 的 定位 。 这 样 ， 当 你 浏览 有 关 人 工 知 能 的 
网 站 的 时 候 ， 你 将 不 会 看 到 有 关 交 友和 成 人 用 品 的 广告 。 

于 是 ， 谷 歌 的 AdWords 和 AdSense 系统 可 以 精准 地 引导 大 量 的 注意 力 流动 和 资 
金 的 流动 ， 同时， 也 赚 取 了 可 观 的 广告 收益 。 人 们 形象 地 将 谷歌 的 这 套 广 告 系统 称 之 
为 谷歌 印 钞 机 |! 


尾声 


本 章 从 人 机 交互 的 角度 重新 审视 了 人 工 智能 , 并 指出 真正 的 人 工 智能 程序 应 该 是 
一 种 平台 ,能够 充分 利用 人 类 的 注意 力 资源 而 滋养 大 大 小 小 的 程序 ， 与 此 同时 ， 该 平 
台 还 可 以 牢 牢 地 抓 住 玩家 的 心 ， 将 它们 粘 到 这 个 虚拟 的 数字 世界 中 。 

我 们 不 妨 科幻 一 下 ， 当 这 样 的 人 机 交互 智能 平台 实现 的 时 候 ， 世 界 将 会 是 什么 样 
子 的 呢 ? 也 许 ， 一 些 奇妙 的 事情 将 会 发 生 。 让 我 们 引用 《 哥 德 尔 、 艾 舍 尔 、 巴 替 : 集 
异 壁 之 大 成 》 一 书 中 的 一 段 对 话 来 描述 这 种 奇妙 的 情景 吧 。 
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在 这 段 对 话 中 出 场 的 人 物 有 蚁 蟹 、 巴 贝 奇 、 阿 基 里 斯 和 马 怨 。 巴 贝 奇 号 称 目 己 发 
明了 一 个 比 目 己 聪明 六 倍 的 计算 机 (在 文章 中 称 为 灵 尝 机 ) 程序 ， J 
灵 ”， 于 是 他 领 看 他 的 朋友 蝶 角 、 en de es 前 面 ， 这 人 台 机 洒 安 冯 
本 传 声 简 和 电视 援 像 机 作为 输入 ， 淡 了 扬 声带 作为 输出 。 


( 巴 贝 奇 坐 下 来 ， 调 了 一 下 座位 。 唾 了 一 两 下 手指 ， 仰 头 看 了 一 下 ， 然 
后 手指 慢 慢 地 落 到 了 键 上 …… 难忘 的 几 分 钟 过 后 ， 他 停止 了 对 灵 策 机 猛烈 的 
弹 击 ， 这 时 ， 每 个 人 看 上 去 都 如 释 重 负 。) 

巴 贝 奇 : 如 果 我 没 出 太 多 错误 的 话 ， 这 台 灵 策 机 能 模拟 秆 力 比 我 高 六 倍 
的 人 ， 我 已 想 好 把 它 称 作 “ 艾 伦 .图 灵 ”， 这 个 图 灵 将 因此 一 一 哦 ， 我 怎 敢 
斗 胆 以 己 说 为 准 有 具备 中 等 水 平 的 智力 。 在 此 程序 中 ,我 倾 力 以 赋予 艾 
伦 :图 灵 六 倍 于 我 的 音乐 能 力 , 虽然 这 一 切 都 是 通过 严格 的 内 部 编码 完成 的 。 
我 不 知道 程序 的 这 一 部 分 产生 的 效果 怎么 样 ， 但是， 这 个 程序 在 运行 时 会 使 
计算 es NR 这 是 这 一 程序 唯一 的 缺憾 。 

图 灵 : 没有 嗓音 我 照样 行 。 无 误 地 插入 严格 的 内 部 编码 可 赋予 一 台 计 算 
训 相 外 了 不 起 的 译 才 能 。 可 和 并 不 是 一 台 计 算 机 ， 

阿 基 里 斯 : 我 是 不 是 听 到 了 一 个 新 的 声音 进入 了 我 们 的 对 话 ? 它 会 是 艾 
合 . 图 灵 吗 ? 他 看 起 来 几乎 就 是 个 真人 ! 

(屏幕 上 出 现 了 他 们 正 坐 在 其 中 的 那个 房间 的 图 案 ， 上 面 有 一 张 人 脸 看 
着 他 们 。) 

图 灵 : 如 果 我 没 出 太 多 错误 的 话 ， 这 台 呈 条 机 能 模拟 智力 比 我 高 六 倍 的 
人 ,我 已 想 好 把 它 称 作 “ 查 尔 斯 * 巴 贝 奇 ， 这 个 巴 贝 奇 将 因此 哦 ， 我 
怎 敢 斗 胆 以 己 说 为 准 一 一 具备 中 等 水 平 的 智力 。 在 此 程序 中 ,我 倾 力 以 赋予 
查尔斯 * 巴 贝 奇 六 倍 于 我 的 音乐 能 力 ， 虽然 这 一 切 都 是 通过 严格 的 内 部 编码 
完成 的 。 我 不 知道 程序 的 这 一 部 分 产生 的 效果 怎么 样 ， 但 是 ， 这 个 程序 在 运 
行 时 会 使 计算 机 发 出 一 些 品 音 ， 这 是 这 一 程序 唯一 的 缺憾 。 

阿 基 里 斯 : 不 ， 不 ， 正 好 相反 。 你 ， 艾 伦 .图 灵 ， 采 在 灵 策 机 里 ， 而 查 
尔 斯 . 巴 贝 奇 刚 刚 把 你 用 程序 编 出 来 ! 我 刚 看 着 你 被 赋予 生命 ， 就 在 几 分 钟 
之 前 。 我 们 知道 你 对 我 们 说 的 每 一 句 话 都 不 过 是 某 种 自动 装置 的 产物 : 某 种 
受 探 的、 无 意识 的 反应 。 

图 灵 : 绝 无 插 入 受 控 反应 这 种 事 ， 也 没 被 赋予 格式 化 的 行为 ， 我 一 直 清 
清楚 楚 地 我 行 我 素 。 
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阿 基 里 斯 : 但 我 确信 我 看 到 了 事情 正 像 我 所 描述 的 那样 发 生 了 。 

图 灵 : 记忆 经 常 玩弄 些 奇 怪 的 把 戏 。 请 想 想 : 我 也 可 以 同样 认为 你 们 只 
是 在 一 分 钟 之 前 才 赋 了 予 生命 ,你 们 记忆 中 的 全 部 经 验 不 过 是 某 种 别 的 存在 物 
编 好 的 程序 ， 同 现实 中 的 事件 毫 无 对 应 。 

阿 基 里 斯 : 但 这 是 令 人 难以 置信 的 。 对 我 来 说 ， 没 有 什么 比 我 的 记忆 更 
实在 了 。 

图 灵 : 没 错 儿 。 正 像 你 对 没有 人 一 分 钟 之 前 才 把 你 创造 出 来 这 一 点 深信 
不 疑 一 样 ， 我 对 我 自己 不 是 一 分 钟 之 前 才 被 别人 创造 出 来 这 点 也 深信 不 疑 。 
我 在 你 们 这 些 最 令 人 愉快 的 、 虽 然 也 许 是 过 于 易于 相处 的 人 们 中 度 0 
宵 ， 并 作 了 一 番 即 兴 表 演 ， 显 示 了 怎样 将 智力 编 成 程序 输入 到 灵 策 机 中 。 
DA Oe Wo 
来 ， 可 以 向 “查尔斯 巴 贝 奇 ” 问 任 何事 ! 

阿 基 里 斯 : 好 吧 ， 咱 们 就 迁就 迁就 艾 伦 .图 灵 吧 。 嗯 ， 巴 先生 ， 您 是 有 
自由 意志 呢 , 还 是 为 那 种 事实 上 使 您 成 为 确定 性 的 自动 装置 的 Se 
配 呢 ? 

巴 贝 奇 : 当然 是 后 者 ， 这 是 无 需 和 争辩 的 。 

螃蟹 : 啊 哈 ! 我 早 就 猜测 ， 智 能 机 一 旦 建立 ， 如 果 发 现 他 们 在 对 心灵 、 
意识 、 自 由 意志 诸如 此 类 事物 上 的 信念 同人 一 样 混乱 、 一 样 固 执 ， 那 将 是 不 
足 为 怪 的 。 现 在 ， 我 的 预言 被 证 实 了 ! 

图 灵 : 您 瞧 查 尔 斯 ， 巴 贝 奇 有 多 混乱 ? 

巴 贝 奇 : 我 希望 ， 先 生 们 ， 你 们 能 原谅 刚才 图 灵 的 话 中 那 十 分 无 理 的 口 
气 。 图 灵 已 经 变 得 有 点 比 我 预期 的 更 好 斗 更 好 辩 了 。 

螃蟹 :天 哪 ! 图 巴 之 战 的 火焰 念 烧 念 烈 , 我 们 难道 不 能 让 他 们 冷静 些 吗 ? 

巴 贝 奇 : 我 有 个 建议 : 艾 伦 ' 图 灵 和 我 可 以 到 另 一 个 房间 去 ， 而 你 们 在 
这 里 的 某 个 人 可 以 通过 往 一 台 灵 策 机 键入 一 些 话 来 远 距 离 地 质问 我 们 。 你 们 
的 问题 分 别传 给 我 俩 ， 我们 可 以 不 具名 地 键 给 你 们 我 们 各 自 的 答案 。 你 们 在 
我 们 回 到 这 个 房间 之 前 ， 将 不 会 知道 是 谁 打 来 的 。 这 样 ， 你 们 就 可 以 不 带 偏 
见地 判定 我 们 中 的 哪 一 方 是 被 程序 编 出 来 的 ， 哪 一 个 是 程序 设计 者 。 

图 灵 : 当然 ， 这 实际 上 是 我 的 主意 。 但 是 为 什么 不 让 巴 先 生得 到 这 一 荣 
誉 呢 ? 因为 ,作为 我 所 写 下 的 一 个 程序 ,他 会 错 以 为 这 完全 是 他 自己 的 发 明 哩 。 

巴 贝 奇 : 我 ， 是 你 写 下 的 一 个 程序 ” 我 坚持 认为 ， 图 先生 ， 是 您 弄 
反 了 一 一 正 像 过 一 会 儿 您 自己 的 测验 将 揭示 出 的 那样 。 
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图 灵 : 我 的 测验 ? 请 把 它 看 作 是 您 的 吧 。 

巴 贝 奇 : 我 的 测验 ? 请 把 它 看 作 是 您 的 吧 。 

螃蟹 : 这 个 测验 看 来 提出 的 正 是 时 候 ， 让 我 们 马上 开始 吧 。 

( 巴 贝 奇 走 到 门 前 ， 出 去 后 又 关上 。 同 时 ， 在 灵 策 机 屏幕 上 ， 图 灵 走 到 
一 扇 看 去 极为 相像 的 门 前 ， 打 开 ， 出 去 后 又 关上 。 ) 

(之 后 ， 螃 蟹 、 阿 基 里 斯 和 乌龟 几 个 人 开始 对 巴 比 奇 和 图 灵 进 行 图 灵 测 
试 ， 他 们 提出 了 一 大 堆 难以 回答 的 问题 ， 但 是 仍然 不 能 区 分 哪个 是 程序 ，* 
个 是 真人 。 ) 

(正在 他 们 谈话 时 ， 前 庭 的 门 打 开 了 ; 与 此 同时 ， 屏 幕 上 同一 扇 门 也 打开 
了 。 屏 幕 上 巴 贝 奇 穿 门 而 过 ; 同时 , 真人 大 小 的 图 灵 从 真实 的 门 中 走 了 进来 。) 

巴 贝 奇 : 这 种 图 灵 测 验 一 无 所 获 ， 所 以 我 决定 回来 了 。 

图 灵 : 这 种 巴 贝 奇 测 验 一 无 所 获 ， 所 以 我 决定 回来 了 。 

阿 基 里 斯 : 可 刚才 你 是 在 灵 策 机 里 的 ! 怎么 回 事 ? 巴 贝 奇 怎么 跑 到 了 灵 
策 机 里 ， 而 图 灵 现 在 却 成 了 真人 呢 ? 无 端的 颠倒 ! 这 一 插曲 加 入 得 没 道理 ， 
谈话 被 赋予 了 新 格局 。 

巴 贝 奇 : 说 到 颠倒 ， 你 们 这 些 人 怎么 都 成 了 我 面前 这 个 屏幕 里 的 图 像 
啦 ? 我 离开 的 时 候 ， 你 们 还 都 是 有 血 有 肉 的 呢 ! 

阿 基 里 斯 : 这 就 像 我 喜欢 的 艺术 家 埃 使 尔 的 那 幅 《 务 手 》( 见 图 8-18 )。 
两 只 手中 的 每 一 只 都 在 画 另 一 只 ， 就 好 像 两 个 人 (或 自动 机 ) 中 的 每 个 人 都 
把 对 方 编 成 了 程序 ! 而 每 只 手 都 有 某 些 东 西 比 另 一 只 手 更 真实 。 


8-18 
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古 希 腊 人 赫 拉 克利 特 说 :“ 万 物 皆 流 。 在 我 看 来 ， 这 不 是 一 个 模糊 的 隐喻 ， 而 是 
综合 兰 诛 刻 的 洞察 。 真 实物 理 世 界 的 河流 、 城 市 交通 流 以 及 虚拟 世界 的 注意 力 流 三 者 
之 间 具 有 很 多 相似 性 ,而且 在 各 类 流 系统 中 普 调 存在 春 标 度 律 。 本 草 将 着 重 介绍 我 们 
进行 的 注意 力 流 的 相关 研究 ， 并 介绍 经 典 的 解释 流 系统 中 的 标 度 律 的 模型 ,最 后 将 对 
注意 力 流 与 集体 智能 之 间 的 关系 进行 详细 的 讨论 。 


真实 世 表 与 虚拟 世 珊 的 流 网 络 


无 论 是 在 真实 世界 还 是 虚拟 世界 ， 痢 广泛 存在 着 流 网 络 。 下 面 我 们 惑 以 河流 、 区 
通 流 和 注意 力 流 为 例 ， 为 大 家 展示 “ 流 ” 的 魅力 。 


河流 网 络 


首 和 匈 来 看 一 下 我 们 最 熟悉 的 流动 系统 


河流 ,如 图 9-1 、 图 9-2 和 图 9-3 所 示 。 
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图 9-2 美国 河流 〈 局 部 一 ) 


图 9-3 ”美国 河流 局 部 二 ) 


以 上 三 幅 图 是 美国 人 尼尔森 ( Nelson ) 的 作品 *"。 他 使 用 了 美国 河流 的 公开 数据 
集 (NHD Plus dataset”)， 结 合 D3.js (一 个 数据 可 视 化 软件 包 ) 等 软件 来 制作 这 个 系 
列 的 可 视 化 图 。 在 图 中 ,河流 的 粗细 与 水 量 成 正比 。 我 们 非常 熟悉 的 河流 网 络 在 经 过 
这 样 的 可 视 化 之 后 ， 呈 现 出 了 许多 美 得 令 人 吃惊 的 细节 。 


城市 交通 网 络 


图 9-4 中 的 四 幅 图 是 艾 瑞 克 : 费 雪 ( Eric Fischer ) 的 作品 ”。 他 使 用 推 特 ( Twitter ) 
的 数据 接口 (API ) 收集 了 各 大 城市 一 部 分 用 户 在 发 推 文 时 的 地 理 坐 标 信 息 ， 并 且 使 
用 Dijkstra 算法 , 计算 出 每 个 用 户 在 两 个 发 推 文 地 址 之 间 沿 道路 网 络 最 短 距 离 的 路 线 ， 
把 这 些 路 线 重 琶 在 一 起 。 最 后 在 呈现 的 时 候 , 人流 越 多 的 路 线 画 得 越 粗 。 从 这 些 图 中 ， 
我 们 不 仅 能 直观 地 感觉 到 不 同城 市 因为 地 理 、 历 史 等 因素 形成 的 不 同 规划 ， 也 能 结合 
其 他 变量 ( 例如 人 口 分 布 等 ) 分 析出 城市 的 交通 规划 是 否 合理 一 一 道路 网 络 是 否 在 有 


效 地 输 运 流量 。 


中 图片 来 源 : http://www.somebits.com/weblog/tech/vector-tile-river-map.html。 
@) 图 片 来 源 : http://www.herizon-systems.com/nhdplus/。 
(3) 更 多 作品 见 https://www.flicker.com/photos/walkingsf/。 
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纽约 伦敦 


多 伦 多 东京 


9-4 ”四 个 国际 大 城市 的 交通 网 络 


其 实 , 使 用 城市 居民 的 移动 数据 并 不 是 绘制 带 权 重 的 街道 网 络 的 唯一 方式 ， 仪 仅 
是 把 街道 真实 的 宽度 展示 出 来 ， 也 能 得 到 粗细 不 均 的 脉络 图 ,这 也 是 谷歌 地 网 等 地 图 
的 稼 见 形式 ， 在 这 里 台 不 详 述 了 。 第 三 种 方法 是 ， 在 仅 有 街道 网 络 数据 、 没 有 街道 宽 
度 或 者 流量 数据 的 时 候 ， 可 以 计算 每 条 街道 的 中 介 度 (betweeness )， 即 其 他 任意 两 条 
街道 之 间 的 最 短路 径 有 多 少 条 要 经 过 该 条 街道 ， 然 后 依据 中 介 度 来 显示 街道 粗细 ， 几 
9-5 展示 了 德国 城市 Dresden 的 街道 。 
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9-5 德国 城市 Dresden 的 街道 网 络 〈 图 片 来 自 Lammer et al.，2006 ) 


仔细 观察 的 话 , 会 发 现 基于 中 介 度 的 交通 网 络 可 视 化 效果 稍 逊 于 基于 个 体 移 动 数 
据 的 交通 网 络 。 后 者 更 好 地 体现 了 交通 流量 如 何 逐 渐 耗 散 以 致 最 终 消 失 的 过 程 ， 对 主 
二 街道 是 如 何 由 粗 变 细 有 更 细致 的 刻画 ， 与 河流 网 络 更 相似 ， 也 更 关 。 


注意 力 流 网 络 


Digg 是 一 个 在 美国 很 流行 的 新 闻 网 站 。 用 户 可 以 对 新 闻 进 行 投票 , 让 其 他 用 户 看 
到 目 己 党 得 有 意思 的 新 闻 。 在 一 段 时 间 〈 例 如 一 天 ) 内 ， 一 个 用 户 不 断 地 对 新 闻 进 行 
投票 ， 可 以 视 为 用 户 在 一 个 由 新 闻 故 事 构 成 的 空间 内 游 走 ， 从 一 个 新 闻 “ 跳 ”到 为 一 
个 新 闻 。 如 来 同时 考虑 在 同一 时 间 内 大 量 用 户 的 游 走 ， 就 得 到 一 个 流 网 络 。 这 个 流 网 
络 实际 上 反映 了 用 户 的 集体 注意 力 在 不 同 新 闻 故 事 之 间 的 分 配 和 迁移 。 


图 9-6 是 我 绘制 的 , 其 中 图 9-6a 展示 了 由 一 个 用 户 形 成 的 一 条 非常 长 的 游 走路 径 
(为 了 美观 我 将 其 压缩 成 一 个 球 )， 图 9-6b 展示 了 把 几 万 用 户 的 游 走 路 径 合 并 后 的 结 
有 果 。 在 两 个 网 络 中 ,节点 是 新 闻 故 事 , 不 同 颜色 代表 不 同 的 主题 ,例如 体育 、 财 经 等 。 
为 了 让 图 更 美观 易 懂 ， 图 9-6b 只 显示 了 用 户 量 在 500 以 上 的 连 边 。 


~ 
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图 9-6 ”Digg 网 站 的 单个 用 户 流动 〈a) 和 集体 用 户 流动 (b) 〈 另 见 彩 择 ) 
不 和 


本 
排名 前 一 千 的 网 站 间 游 走 形成 的 轨迹 ,不同 语言 的 网 站 用 不 同 
I 迹 , 不 同 语言 的 网 站 用 不 同 颜色 表示 。 其 中 , 数 


9-7 ”用户 在 世 表 排名 前 一 千 的 网 站 间 游 走 形成 的 流 网 络 〈 另 见 彩 插 ) 
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图 9-6 和 图 9-7 展示 了 什么 是 注意 力 流 网 络 ， 但 我 们 为 什么 要 研究 注意 力 流 网 络 
呢 ? 这 并 不 是 一 时 好 奇 的 结果 ， 而 是 经 过 了 长 期 的 思考 、 摸 索 和 试 错 。 


我 和 北京 师范 大 学 的 张江 博士 于 2009 年 在 集 知 俱乐部 的 线 下 活动 中 认识 ， 我 们 
一 见 如 故 ， 一拍即合 ， 决定 一 起 使 用 复杂 网 络 的 研究 方法 来 研究 互联 网 社区 。 最 早 我 
们 像 大 多 数 人 研究 者 一 样 ， 和 尝试 把 用 户 作 为 方 点 ， 把 用 户 之 间 的 交互 (例如 社交 网 络 上 
的 转发 行为 ) 作为 连 边 ,构造 “用 户 网 络 ”(user-network ), 来 研究 信息 的 扩散 。 但 很 
快 我 们 就 发 现 这 并 不 是 最 好 的 建 模 方式 ， 因 为 用 户 网 络 中 没有 “守恒 量 ”。 在 互联 网 
社区 中 , 一 条 信息 理论 上 可 以 被 转发 无 数 次 ， 而 究竟 什么 样 的 信息 资源 能 得 到 大 量 的 
关注 ， 却 几乎 完全 无 迹 可 寻 。 非 常 类 似 的 新 闻 改 事 ， 有 可 能 在 一 个 时 间 点 引爆 关注 ， 
在 另 一 个 相近 的 时 间 点 却 无 人 问津 。 虽 然 用 户 网 络 的 建 模 方法 因为 符合 直觉 ， 渐 渐 成 
为 “主流 ”， 我 们 却 决 定 走 另外 一 条 道路 ,“ 逆 流 而 动 " ， 这 就 是 注意 力 流 网 络 
( attention-network )。 

构建 注意 力 流 网 络 和 构建 用 户 网 络 所 需要 的 数据 其 实 是 一 样 的 , 就 是 网 站 的 日 志 
(log file ) 一 一 其 中 记载 了 用 户 与 信息 资源 的 交互 。 在 注意 力 流 网 络 中 有 一 个 很 明确 
的 守恒 量 ， 就 是 整个 网 络 内 的 注意 力 存 量 。 注意 力 是 一 种 稀缺 资源 , 虽然 整个 互联 网 
中 流动 的 人 类 注音 力 现在 还 在 不 断 地 增长 ， 但 最 终 要 趋 近 一 个 第 量 。 图 9-8 比较 了 从 
2010 年 2 月底 起 两 年 内 互联 网 网 页 总 量 的 增长 和 用 户 数量 的 增长 "。 
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9-8 ”网 页 浏览 量 增长 情况 


中 网 页 增长 数据 参考 http:/www.worldwidewebsize.com/, 用 户 数量 增长 数据 参考 http:/www.internetworldstats. 
com/emarketing.html。 
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有 了 常量 我 们 就 可 以 建立 方程 来 描述 人 类 的 集体 注意 力 在 信息 资源 上 的 分 配 。 请 
注意， 在 我 们 这 种 框 染 下 仍然 可 以 卫 观 地 描述 新 闻 、 帖 子 、 视 频 等 信息 资源 的 爆发 与 
慷 亡 : 当 注 六 力 流 集中 到 一 个 市 点 上 时 ， 它 就 流行 ; 当 该 节点 不 再 获得 注音 力 流 时 ， 
化 就 孜 亡 了 。 

除了 集体 注意 力 总 量 守恒 外 , 注意 力 流 网 络 的 另 一 个 优势 是 可 以 比较 不 同 互联 网 
行为 所 消耗 的 人 类 注意 力 的 质量 。 最 基础 的 互联 网 行为 就 是 点 击 。 一 连 串 的 点 击 , 一 
般 称 为 一 个 会 话 ( session )， 其 实 就 是 图 9-6a 显示 的 那样 一 条 流 。 大 量 用 户 在 同一 段 时 
间 内 产生 许多 点 击 ， 就 构成 点 击 流 网 络 (clickstream network )。 从 点 击 、 给 照片 加 标签 、 
对 帖子 发 评论 、 编 辑 维 基 百 科 ， 到 在 GitHub 上 共同 编辑 代码 ， 用 户 在 互联 网 上 的 不 同 
行为 , 完成 者 难度 非常 不 同 的 任务 , 消耗 着 不 同 质 量 的 注 蕊 力 。 这 些 不 同 的 互联 网 行为 
很 难 在 用 户 网 络 中 进行 比较 , 但 在 注意 力 网 络 里 , 我 们 却 可 以 通过 分 析 注 意 力 流 的 速度 
和 结构 来 百 接 比较 不 同 复 杂 度 的 互联 网 行为 。 


各 类 流 系 统 内 的 标 度 律 (scaling law) 


见识 过 尼尔森 的 美国 河流 可 视 化 图 后 ， 相 信 大 家 一 定 为 之 感到 宕 撼 。 其 实 ， 更 令 
人 居 叹 的 是 ， 科 学 家 们 发 现 表 面 看 起 来 随意 、 文 离 破碎 的 河流 结构 ， 育 后 却 隐 藏 春 统 
一 的 规律 。 大 卓然 就 是 如 此 ， 美 的 事物 背后 往往 有 着 深刻 的 规律 。 


河流 与 Hack 定 律 


20 世纪 50 年 代 以 来 ， 人 们 利用 各 种 地 理 勘 测 方法 对 河流 系统 进行 了 研究 ， 发 现 
了 一 些 在 不 同 河流 系统 中 都 存在 的 普 适 规 律 ， 其 中 一 条 就 是 Hack 定律 。 这 条 定律 指 
出 ,在 河流 网 络 中 , 支流 的 长 度 ( stream length )L 和 相对 应 的 蓄 水 兮 地 面积 ( basin area ) 
a 之 间 存 在 如 下 标 度 关系 : 


L~a’ (1) 
其 中 及 的 数值 在 大 多 数 水 系 的 实证 数据 中 都 被 测 为 0.6 左右 。 


图 9-9 展示 的 是 意大利 北部 一 条 叫 Fella 的 河 的 河流 网 络 。 右 上 角 的 小 图 突出 展示 
了 主干 流 的 长 度 和 人 给 地 面积 。 本 数据 中 有 hh 的 估计 值 为 0.57 ~ 0.6。 当然 , 在 实证 研究 中 ， 
仪 仪 研究 一 对 工 与 4 的 关系 是 不 够 的 ， 需 要 对 网 络 中 的 每 一 条 文 流 进行 测量 ， 得 到 许 
多 对 工 与 4 的 关系 ,才能 使 用 双 对 数 坐 标 系 下 最 小 二 乘 回归 等 方法 对 标 度 指数 疡 作出 
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一 个 比较 合理 的 仿 计 。 


9-9 ”意大利 北部 Fella 河 的 支流 结构 (图 片 来 自 Maritan et al., 1996) 


实测 的 及 指数 在 0.6 左右 ， 这 引起 了 科学 家 们 的 兴趣 。 因 为 如 果 我 们 生活 的 世界 
是 严格 意义 上 的 欧 氏 几何 世界 ， 那么 河流 相当 于 一 维 对 象 ， 倪 地 相当 于 二 维 对 象 ， 河 
流 长 度 与 盆地 面积 之 间 的 标 度 关 系 , 理论 上 应 该 是 正方 形 的 边 长 与 面积 之 间或 者 圆 形 
的 直径 和 面积 之 间 的 1/2 震 律 关系 。 当 面积 变 成 原来 的 4 倍 时 , 边 长 只 变 成 原来 的 4 
=2 倍 。h 不 等 于 1/2 引 发 了 科学 家 们 对 河流 网 络 其 实 是 一 个 分 形 结构 的 猜想 。 如 果 我 
们 认为 河流 盆地 是 一 个 如 此 复杂 起 伏 不 平 的 二 维 分 形 对 象 ， 以 至 于 分 形 维 数 接近 于 三 
维 , 并 且 认 为 河流 是 一 个 非常 复杂 的 一 维 对 象 , 以 至 于 分 形 维 数 接近 于 二 维 , 那么 0.6 
左右 〈 约 等 于 2/3 ) 的 指数 就 可 以 理解 了 。 
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血 流 与 Kleiber 定 律 
除了 河流 网 络 之 外 ， 人 们 又 在 大 自然 许多 其 他 的 流 网 络 中 发 现 了 类 似 于 Hack 定 
律 的 标 度 律 ，Kleiber 定 律 就 是 最 著名 的 一 个 例子 ， 如 图 9-10 所 示 。 
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9-10 ”从 单 细胞 生物 到 大 象 都 满足 的 Kleiber 定律 (图 片 来 自 West & Brown, 2005) 


Kleiber 定律 预测 生物 体 的 能 量 消耗 FF 和 体积 M 之 间 存 在 如 下 关系 : 
F~M:’ (2) 


其 中 s 的 数值 在 大 多 数 生物 的 实证 数据 中 都 被 测 出 是 0.75 左右 。 注意 标 度 律 往往 使 用 
双 对 数 坐 标 系 表 示 ， 因 此 一 个 坐标 轴 上 右 移 一 个 单位 代表 升 到 一 个 新 的 量 级 。 从 图 
9-10 的 模 轴 中 可 以 看 出 来 ， 从 单 细胞 生物 到 大 象 ， 这 个 定律 模 跨 了 接近 30 个 量 级 ， 
接近 从 沙 粒 到 银河 系 的 量 级 跨越 。 在 亿 万 年 的 漫长 进化 时 间 中 ， 沿 着 完全 不 同 分 支 进 
化 出 来 的 生物 体 ， 居 然 能 在 如 此 惊人 的 空间 尺度 上 ,保持 着 稳定 的 规律 ， 这 无 疑 是 非 
第 令 人 吃惊 的 。 

以 Kleiber 定律 为 基石 ，West 和 Brown 提出 了 生物 的 “新 陈 代谢 理论 ”( metabolic 
theory )。 他 们 收集 了 大 量 数据 证 明 ， 生 物体 的 运动 、 发 育 、 繁 衍 中 的 各 项 指标 ,例如 
心跳 速率 、 生 命 长 度 、 发 育成 熟 时 间 、 种 群 数量 等 ,都 导体 积 有 看 可 预测 的 标 度 关系 ， 
这 些 标 度 关 系 都 可 以 从 Kleiber 定律 中 推演 出 来 ， 就 好 比 可 以 从 牛顿 定律 中 推导 出 李 
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圆 形 的 太阳 系 行星 运动 曲线 一 样 。 


Kleiber 定律 既然 如 此 重要 ，West 和 Brown 等 人 目 然 也 提出 了 理论 , 希望 能 对 其 
成 因 进 行 解 释 。 如 采 我 们 把 生物 体 的 能 量 消耗 看 作 与 其 皮肤 面积 成 正比 的 一 个 量 , 那 
么 ,根据 在 Hack 定律 的 例子 中 讨论 过 的 欧 氏 几何 的 猜想 ， 能 量 消耗 和 体积 M 之 间 
应 该 是 2/3 的 标 度 关系 。 实测 的 0.75 = 3/4 的 标 度 指数 令 人 再 一 次 想到 分 形 结构 : 如 采 
考虑 到 皮肤 不 是 光滑 的 而 是 起 伏 不 平 的 二 维 结构 以 至 接近 三 维 , 生物 个 体 则 是 非常 复 
琳 的 三 维 结构 以 至 接近 四 维 ， 那么 3/4 的 标 度 指数 就 可 以 理解 了 。 


但 是 ， 如 果 说 “非常 复杂 的 二 维 结 构 接 近 三 维 ” 还 似乎 可 以 理解 的 话 , “接近 四 
维 的 三 维 ” 究 竞 是 一 种 什么 样 的 东西 是 难以 想象 的 。 这 一 点 即便 在 West 1999 年 的 文 
章 “ 生 命 的 第 四 维度 ”( The Fourth Dimension of Life ) 中 也 是 语 破 不详 。 所 以 后 来 West 
和 Brown 还 是 另 尽 踩 径 , 从 生物 内 部 的 毛细 血管 网 络 着 手 ， 建立 理想 输送 网 络 模型 来 
解释 这 个 3/4 标 度 的 形成 。 


注意 力 流 中 的 标 度 律 


继 河 流 网 络 和 生物 体内 新 陈 代谢 网 络 之 后 ， 科 学 家 们 在 食物 网 、 城 市 交通 输 运 
与 国际 贸易 网 络 中 都 发 现 了 类 似 于 Kleiber 定律 的 标 度 律 。 实 际 上 ，Hack 定律 与 
Kleiber 定律 是 类 似 的 ， 都 是 描述 在 时 空 结构 约束 下 的 流 网 络 “ 流 量 ” 与 “存量 ”的 
关系 。 


那么 ， 一 个 注意 力 流 网 络 的 注意 力 流量 和 存量 分 别 对 应 春 什 么 呢 ? 我 们 发 现 ， 妆 
我 们 仅 考 感 最 基本 的 点 击 行为 时 ， 其 实 它们 正 对 应 着 工业 界 非 背 关 心 的 两 个 指标 : 
UV (Unique Visitors， 独 立 用 户 数 ) 和 PV ( Page Views， 页 面 点 击 率 )。 为 了 理解 
这 一 点 ， 下 面 我 们 来 看 一 个 真实 物理 世界 的 例子 。 


图 9-11a 是 香港 的 地 铁路 线 图 ， 图 9-11b 是 上 海 某 商场 。 它 们 虽然 可 以 看 作 某 种 
人 流 输 运 系统 ， 却 有 着 非常 不 同 的 功能 。 前 者 的 设计 目的 是 最 小 化 存量 ， 后 者 的 设计 
目的 是 最 大 化 存量 。 


香港 地 铁 因 便捷 的 换 乘 机 制 而 著名 。 在 各 个 主要 换 乘 站 《不 同 颜色 的 地 铁路 线 交 
接 的 地 方 )， 同 层 月 全 的 为 一 端 并 不 是 该 路 线 的 回程 车 ， 而 是 为 外 一 个 路 线 的 列车 。 
这 是 符合 常识 的 ， 我 们 可 以 假设 大 部 分 在 换 弱 站 下 和 车 的 旅客 部 是 为 了 去 为 外 一 个 路 
线 ， 而 不 是 往 回 坐 。 于 是 这 种 换 弱 设计 使 得 大 部 分 乘客 只 要 走 几 步 到 为 一 端 月 台 等 候 
束 可 以 了 。 如 来 月 从 两 端 列 车 同时 抵达 ， 乘客 甚至 不 必 在 地 铁 站 内 符 候 逗留 ， 在 几 十 
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秒 内 就 可 以 完成 换 乘 任务 。 


图 9-11 香港 地 铁 (a) 与 上 海 商场 (b) 的 比较 


最 新 建成 的 北京 地 铁 线 ( 例如 7 号 线 ) 也 参考 了 香港 地 铁 的 设计 ,但 早年 建成 的 
地 铁 线 ， 例 如 1 号 线 、2 号 线 、13 号 线 等 ,并 非 如 此 。 换 乘 站 和 非 换 乘 站 一 样 ， 月 台 
刃 一 喘 一 律 是 回程 车 。 大 批 买 客 要 走 楼 梯 或 者 坐 电梯 去 为 外 一 层 月 台 才 能 换 习 , 造成 
地铁 内 部 尤其 是 楼 梯 口 的 极端 拥堵 。 


与 地 铁 最 小 化 存量 的 优化 思路 相反 ， 商场 的 设计 则 遵循 截然 不 同 的 价值 观 。 如 图 
9-1lb 所 示 ， 我 们 见 到 的 大 部 分 商场 ， 往 往 是 上 楼 的 电梯 聚集 在 商场 的 一 端 ， 下 楼 的 
电梯 聚集 在 万 一 问 。 这 是 为 了 强迫 顾客 经 过 商场 的 各 个 柜 合 。 有 些 极 冰 不 友好 的 商场 ， 
故意 把 电 樟 藏 在 迷 写 般 的 一 大 礁 柜 人 台 里 面 ， 顾 客 不 纸 过 所 有 柜 合 就 找 不 到 离开 的 路 。 


假设 地 铁 和 商场 的 人 流 达 到 了 一 种 动态 平衡 ， 即 进入 系统 的 人 数 保 持 相 同 的 规 
模 ,， 这 就 相当 于 网 站 的 UV, 在 系统 内 逗留 的 人 数 相 当 于 网 站 的 PY， 所 以 这 两 者 的 关 
系 就 相当 于 Kleiber 定律 中 能 量 消耗 忆 和 体积 M 的 关系 。 如 果 Kleiber 定律 在 注意 力 流 
网 络 中 也 存在 的 话 ， 应 该 有 以 下 关系 : 
PV~ UV (3) 
0 代表 网 络 的 粘性 ， 应 该 是 大 于 1 的 ， 这 是 因为 在 Kleiber 定律 中 如 果 我 们 把 体 
积 MM 写成 能 量 消耗 五 的 洱 数 ， 则 指数 是 4/3 ~ 1.33。 


2013 年 ， 我 们 对 百度 贴吧 的 数据 进行 了 分 析 ， 考 察 了 用 户 流量 最 大 的 三 万 个 吧 ， 
发 现 式 (3) 广 泛 地 存在 于 这 些 吧 中 ( 见 图 9-12 )。 9 指数 的 平均 值 是 1.06。 实 际 上 ， 这 
是 因为 许多 小 吧 的 噪音 干扰 导致 9 接近 于 1。 如 果 我 们 只 考虑 规模 较 大 的 前 1000 个 吧 
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的 话 ， 2 的 平均 值 接近 1.2。 


图 9-12 在 三 万 个 贴吧 中 发 现 的 PV 对 UV 的 标 度 律 、D; 对 三 的 耗 散 律 以 及 对 三 万 个 贴吧 考察 得 到 的 两 
个 标 度 律 的 指数 之 间 的 关系 
根据 我 们 对 地 铁 和 商场 设计 的 讨论 可 知 , 虽然 0 是 网 络 社区 在 时 间 增 长 中 表现 出 
来 的 标 度 指数 ， 但 它 本 质 上 取决 于 流 结构 的 设计 。 在 研究 中 我 们 使 用 另 一 个 标 度 律 来 
刻画 这 种 流 结构 设计 中 最 重要 的 性 质 : 流 的 耗 散 。 
Di ~7? 人 
/ 越 大 ， 说 明 耗 散 得 越 厉 害 ， 越 接近 于 地 铁 而 不 是 商场 的 设计 ， 此 时 9 的 数值 就 
应 该 越 小 。 实 际 上 ， 我 们 还 可 以 从 网 络 的 流 守恒 中 推导 出 如 下 关系 : 当 关 1] 时 ,1 
9<1; 当 1K1 时 ，1 < 9<1/m。 如 图 9-12c 所 示 ， 我们 关于 耗 散 与 流 存量 增长 之 间 的 关 
系 猜 想 也 被 贴吧 的 数据 证 实 了 。 


流 网 络 标 度 律 的 模型 


对 流 网 络 中 标 度 律 的 探索 ， 从 历史 上 看 ， 前 后 将 近 20 年 的 时 间 ， 经 历 了 从 各 个 
学 科 中 各 目 控 索 到 大 家 达成 共识 的 过 程 。 最 后 的 这 个 共识 就 是 标 度 律 实际 上 是 空间 维 
度 约 束 下 的 最 优化 输 运 网 络 的 表现 。 


Hack 定 律 与 OCN 


前 面 罗 列 了 各 种 流 系 统 中 的 标 度 律 , 并 指出 标 度 律 的 本 质 是 流 网 络 的 流量 和 存量 
的 关系 。 这么 广泛 而 深刻 的 现象 日 然 也 吸引 T 了 许多 优秀 的 科学 家 想 要 提出 模型 来 解释 
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标 度 律 的 出 现 ， 而 大 部 分 模型 都 是 基于 空间 维度 约束 下 网 络 输 运 优化 的 思路 提出 的 。 


20 世纪 90 年 代 ，Rinaldo 等 人 提出 了 一 个 模型 ， 称 为 最 优化 输 运 网 络 (Optimal 
Channel Network，OCN )。 他 们 讨论 了 河流 中 的 Hack 定律 等 标 度 律 ( 式 (1) 和 式 (3) )， 
并 发 现 这 可 能 是 输 运 网 络 最 小 化 输 运 成 本 的 结果 。 

图 9-13 展示 了 三 种 不 同 的 输 运 结构 。 假设 中 心 是 汇 , 周围 充满 六 角形 空间 的 小 点 
是 源 , 我 们 的 任务 就 是 要 设计 一 种 最 佳 网 络 来 完成 从 源 问 汇 输 运 流 的 任务 ,我 们 发 现 ， 
最 上 面 的 结构 总 成 本 最 小 (使 用 的 总 连 边 数 ), 但 平均 成 本 最 大 ( 汇 到 源 的 平均 距离 )， 
第 二 个 结构 则 相反 。 只 有 第 三 个 结构 将 两 个 成 本 都 降 到 了 最 低 。 论 文中 作者 比喻 道 : 
第 一 个 好 比 是 计划 经 济 ， 总 体高 效 ， 但 个 人 不 一 定 高 效 ; 第 二 个 结构 好 比 是 完全 自由 
的 市 场 经 济 ， 大 家 各 目 为 政 ， 虽 然 每 个 源 都 很 高 效 地 完成 癌 汇 输送 流 的 任务 ， 总 体 上 
看 却 造 成 了 资源 的 浪费 ; 第 三 个 结构 因为 使 空间 上 临近 的 点 相互 配合 ， 所 以 使 宏观 和 
微观 上 的 成 本 都 最 小 化 了 。 


lr- ‰ SK SR 天 Ep 
L=45.5 . 


a b 


9-13 ”不 同类 型 的 流 网 络 (a) 及 OCN 的 优化 结果 (b)【 图 片 分 别 来 自 Rinaldo et al.，1992 和 
Rinaldo et al., 2013) 


Rinaldo 等 人 发 现 ， 给 定 一 个 二 维 网 格 结构 ， 从 中 生成 一 个 扩展 树 ( 每 个 节点 都 
只 拥有 一 条 连 边 )， 可 以 定义 出 当前 链接 状态 s 的 能 量 ECs): 


E(s)=>A: (5) 
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其 中 4; 是 节点 i 上 的 直接 流 量 ， 在 二 维 网 格 上 等 于 i 的 所 有 下 游 广 点 数 之 和 。 因 
为 所 有 下 游 的 市 点 都 需要 从 i 绑 取 流量 。 6 根据 实际 河流 网 络 中 的 经 验 数 值 一 般 取 0.5。 
当 网 络 能 量 最 小 时 ， 就 能 得 到 Hack 定律 。 更 令 人 惊奇 的 是 ， 如 末 我 们 使 用 线条 的 粗 
细 来 表示 流量 的 话 ， 此 时 的 网 络 结构 ( 见 图 9-13b ) 长 得 十 分 像 真 实 的 河流 网 络 。 


Kleiber 定 律 与 分 叉 树 


新 陈 代 谢 理论 认为 生物 体 本 质 上 是 一 个 使 用 毛细 血管 来 吸取 和 排放 能 量 的 流 系 
统 ， 因 此 有 理由 认为 生物 体 的 心跳 频率 和 寿命 等 指标 ,基本 上 是 由 毛细 血管 的 结构 决 
定 的 。 在 漫长 的 进化 时 间 里 ， 生 物体 不 断 地 优化 自己 的 毛细 血管 ， 以 至 于 空间 维度 成 
了 唯一 的 约束 一 一 只 要 是 生活 在 三 维 空间 里 的 生物 ， 最 终 都 进化 出 了 表现 为 Kleiber 
定律 的 能 量 消耗 效率 。 

West 等 人 在 1999 年 提出 的 分 又 树 模型 ( 见 图 9-14 ) 是 解释 Kleiber 定律 最 早 的 模 
型 之 一 。 这 个 模型 是 基于 空间 维 约束 加 网 络 最 优化 的 思路 提出 的 ， 它 有 两 大 假设 , 首 
先是 不 论 生物 体积 多 大 ,毛细 血管 的 最 终端 粗细 总 是 一 样 的 ， 因 此 不 同 生物 的 毛细 血 
管 之 间 的 区 别 ， 主 要 在 于 树 状 结构 的 层级 数 ; 其 次 是 毛细 血管 的 分 又 策略 要 令 整 个 网 
络 的 输 运 能 量 最 小 化 。 通 过 讨论 最 优 的 三 维 管道 填充 策略 ，West 等 人 推导 出 了 3/4 这 
个 震 律 指数 。 


9-14 分 又 树 模 型 (图 片 来 自 West et al., 1999) 
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走 同 统一 的 流 系统 标 度 律 


Banavar 等 人 在 1999 年 提出 了 一 个 比 West 的 毛细 血管 更 广义 的 模型 。 他 们 首次 
把 Hack 定律 和 Kleiber 定律 放 在 一 起 讨论 ( 见 图 9-15 )， 并 指出 在 流 系统 中 ， 流 量 FF 
和 存量 M 总 存在 窜 律 关系 


其 中 妃 是 流 系统 所 在 空间 的 维度 。 接着, 他 们 用 一 套 非常 简洁 的 思路 指出 ,这 个 指数 
是 最 小 化 流传 输 成 本 的 必然 结果 。 他 们 假设 流 网 络 存 在 于 一 个 2 的 空间 中 ， 其 中 工 
是 一 维 长 度 ， 网 络 的 汇 ( sink ) 均匀 地 分 布 在 空间 中 ， 因 此 有 N= 个。 最 无 效 的 流 
系统 就 是 像 图 9-15a 右 下 角 的 挤 满 整个 空间 的 链 状 结构 ， 汇 到 达 中 心 源 的 平均 长 度 是 
1=7, 为 了 给 所 有 的 汇 输 运 总 量 为 的 流 , 所 需要 的 存量 成 本 是 M=IN= =(L = 
户 。 最 有 效 的 流 系统 是 像 左 下 角 的 星 状 网 络 ， 汇 到 中 心 源 的 平均 距离 是 L， 因 此 输 运 
总 量 为 所 的 流 所 需要 的 成 本 是 M= IN= LL” 了 = (YW?= PD 


2 Aj (pixel units) 


A (pixel units) 


9-15 不 同 效率 的 输 运 网 络 (a) 和 河流 的 Hack 定律 〈b) 〈 图 片 来 自 人 et al., 1999) 

Dreyer 不 仪 把 Hack 定律 和 Kleiber 定律 放 在 一 起 讨论 , 还 做 了 一 个 小 型 试验 来 测 
试 一 维 水 槽 系统 的 渗流 是 否 真 的 满足 当 D= 1 时 的 式 (6)。 结 论 是 式 (6) 确 实 成 立 。 虽然 
这 只 是 一 个 非常 位 单 的 低 成 本 试验 , 但 在 我 看 来 其 深刻 程度 却 可 以 与 伽利略 测定 小 球 
加 速度 的 试验 相 比 。 因 为 这 个 实验 实际 上 是 把 二 维和 三 维 空间 中 的 对 一 个 法 则 的 观察 
在 近似 的 一 维 空间 中 做 了 验证 ， 从 而 通过 实验 肯定 了 标 度 律 与 空间 维度 的 关系 。 在 大 
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型 粒子 对 撞 机 动 辑 耗 费 几 十 亿美 元 的 今天 ， 居 然 还 存在 这 种 “文艺 复兴 时 代 ” 的 科学 
吞 苇 ， 是 很 令 人 感慨 的 。 

在 解释 标 度 律 时 ，Dreyer 也 考虑 了 一 个 D 维 空间 内 的 中 心 源 系统 。 与 Banavar 等 
人 的 思路 稍 有 不 同 ， 他 把 一 个 流 系统 ， 例 如 生物 体 ， 看 作 一 个 D 维 球 ( 见 图 9-16 )。 
他 认为 这 个 球 不 是 均 质 的 ,中间 的 流 密度 要 比 外 围 大 。 这 是 因为 为 了 维持 生物 体 的 体 
具 ， 距 离 圆心 为 了 处 的 流 j(7) 要 流 到 R 那么 远 的 距离 。 因 此 r 越 小 ， 流 密度 越 大 。 球 
内 任意 一 点 的 密度 是 j(r) ~ R?- 记 ， 因 此 整个 系统 的 存量 是 j(7) 在 整个 球 上 的 积分 ， 正 
比 于 R”， 又 因为 系统 流量 为 广 R ， 所 以 式 (6) 成 立 。 


S.V 
图 9-16 ”生物 体 成 长 过 程 中 的 自 相 似 〈 左 ) 与 生物 体 的 D 维 球 模型 〈 右 ) 〈 图 片 来 自 Banavar et al., 2001) 


本 市 讨论 了 各 种 流标 度 律 的 模型 并 回顾 了 不 同学 科 的 人 研究 是 怎样 走 癌 统一 , 最 后 
就 DA/(D+1) 的 标 度 指数 达成 共识 的 。 但 是 这 项 人 研究 工作 还 远 远 没有 结束 ， 随 着 
Garlaschelli 等 在 食物 网 和 志 界 贸易 网 络 中 发 现 标 度 律 、Bettencourt 等 在 城市 系统 中 发 
现 标 度 律 、 我 们 在 互联 网 社区 中 发 现 标 上 度 律 ,我们 需要 更 广义 的 框架 来 解释 这 些 标 度 
律 。 如 果 说 城市 中 的 标 度 律 还 可 以 用 空间 约束 来 解释 的 话 ， 食 物 网 、 世 界 贸 易 网 络 和 
互联 网 社区 中 的 标 度 律 显然 是 无 法 用 空间 约束 来 解释 的 。 使 用 Rinaldo-Barnavar- 
Garlaschelli 发 展 的 优化 流 网 络 结构 传统 ,去 讨论 介 于 链 状 网 和 星 状 网 这 两 种 极端 情况 
之 间 的 真实 网 络 ， 可 以 定性 地 回答 标 度 指数 的 范围 (例如 ,位 于 1~2 之 间 )， 却 无 法 
准确 预测 标 度 指数 的 数值 。 因 此 ， 这 就 要 求 我 们 继续 探索 这 些 流 网 络 的 约束 条 件 ， 并 
对 约束 条 件 下 的 优化 目标 进行 更 精确 的 表达 。 我 们 现在 从 耗 散 角度 刻画 流 结构 的 研 
究 ， 只 能 说 是 在 沿 着 这 个 方 癌 继续 走 ， 离 发 现 和 预测 注意 力 流 网 络 中 的 普 适 标 度 指数 
这 个 目标 ， 还 有 很 远 很 远 。 
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注意 力 热 机 与 集体 智慧 


19 世纪 时 , 又 汽机 在 工业 与 交通 中 的 作用 越 来 越 午 要 , 但 工程 师 走 在 了 科学 家 的 
前 面 ， 关 于 节 汽 机 是 如 何 把 热 变 为 功 从 而 驱动 机 械 的 一 般 理论 还 没有 形成 。 出 号 于 法 
国 军 队 的 工程 师 卡 话 ( Carnot ) 在 1824 年 出 版 了 《天 于 火 的 动力 的 思考 》， 记 录 了 他 
关于 热 变 成 功 的 科学 模型 。 


FE 话 指出 ， 凡 有 温度 差 束 能 够 庆生 动力 ; 反之 ,利用 动力 也 总 能 形成 温度 差 。 他 
构造 了 一 个 充分 利用 热源 与 冷 源 之 间 温 度 差 的 机 迄 ， 即 卡 诺 热机 ( 见 图 9-17 )， 并 且 
认为 这 个 热机 的 效率 已 经 达到 最 大 。 为 什么 呢 ” 因 为 这 个 热机 是 “可 逆 ” 的 ， 即 这 个 
把 热 变 成 功 的 “ 蒜 汽 机 ”可 以 反 过 来 变 成 “空调 “， 把 功 变 成 热 。 我 们 称 逆 卡 话 热 机 
为 卡 诺 冷 机 。 把 一 个 卡 详 热 机 和 一 个 卡 话 冷 机 结合 在 一 起 ， 构 成 一 个 静止 的 系统 ， 不 
能 对 外 输出 功 ， 也 不 需要 从 外 界 吸 收 功 , 但 这 个 系统 的 热源 和 冷 源 之 间 是 没有 热量 交 
换 的 ， 所 以 热源 和 冷 源 的 温度 都 不 会 变化 。 假设 有 人 声称 造 出 比 卡 话 热机 更 遍 效 的 热 
机 ， 我 们 把 这 个 超级 热机 和 一 个 卡 诡 冷 机 配 在 一 起 ， 构 成 一 个 系统 ， 这 个 系统 与 外 界 
没有 功 的 交换 ， 却 可 以 把 热量 从 冷 源 市 问 热 源 ， 使 得 两 端的 温差 变 大 。 但 我 们 知道 宇 
宙 间 不 可 能 存在 这 样 的 系统 。 通 过 思想 实验 ， 卡 施 证 明了 热 转 化 为 功 的 极 大 效率 仅仅 
与 温差 有 关系 ， 与 工作 物质 和 热机 的 具体 结构 和 材质 无 关 。 


Ql QI1(1+X) 
/ ™ W W | | ; 一 \ WI( 1 +X) WI( ] 十 又 AN 
| | -Hy A 1 pe YF v ~ 
[ 卡 庄 热 机 ) 一 ”一 > 祭 详 冷 机 | 超级 热机 一 一作 诺 冷 机 


Sy > 
my pe 


eorw Q2=Q1-Wi ] 1-W(1+X) oe 上 


= 


9-17 ” 卡 话 热机 是 理想 热机 


回顾 完 卡 诡 热 机 的 原理 后 ,我 们 可 以 思考 这 样 一 个 问题 : 什么 是 热 ? 其 实 热 是 大 
规模 分 子 运 动 的 一 种 安 观 性 质 。 比 如 有 两 杯 水 ， 一 杯 水 中 的 水 分 子 比 万 外 一 杯 水 中 的 
运动 更 剧烈 ， 就 是 更 热 ， 两 杯 水 混 在 一 起 ， 克 3 形成 一 种 “梯度 力 ”。 运 动 快 的 分 子 问 
运动 慢 的 分 子 扩散 ， 这 就 是 一 种 “热流 ”， 最 后 梯度 力 消 失 ， 所 有 分 子 的 运动 速度 趋 
于 一 致 。 从 这 个 例子 可 以 看 出 ， 其 实 卡 诡 热 机 不 仅 可 以 描述 热 与 功 之 间 的 可 逆 循 环 ， 
实际 上 可 以 描述 任意 “梯度 力 ” 与 功 之 间 的 可 逆 循 环 。 例 如 在 化 学 里 ,分子 浓度 形成 
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的 梯度 力也 是 可 以 做 功 的 ， 同 样 也 受热 力学 第 二 定律 的 制约 。 


我 们 前 面 已 经 回顾 了 把 用 户 的 集体 注意 力 看 作 “ 流 ”的 做 法 ,并 且 描 述 了 注意 力 
流 的 一 些 定 量规 律 。 这 些 规律 仅仅 涉及 了 注意 力 流 的 量 ， 而 没有 涉及 注意 流 的 质 。 实 
际 上 ， 我 们 可 以 把 用 户 的 注意 力 看 作 “ 热 源 ” 与 “ 冷 源 "， 而 网 站 或 者 一 般 信息 系统 
束 是 把 注意 力 转 化 为 信息 资源 的 “ 注 章 力 卡 诺 热 机 ”( 见 图 9-18 )。 它 会 在 用 户 进行 编 
辑 维基 百科 或 对 帖子 发 表 评论 等 各 项 互联 网 活动 中 , 不断 地 输出 信息 ， 最终 注 意 力 质 
量 不 断 下 降 ， 产 生 神 经 和 机 体 上 的 疫 务 ， 直 至 离开 网 络 。 这 个 过 程 就 好 比 热 机 做 功 、 
散发 废 热 一 样 。 


图 9-18 ”作为 注意 力 热机 的 大 脑 - 


如 条 注意 力 热机 人 存在， 我 们 可 以 推测 注意 力 冷 机 也 存在 。 与 热机 相反 ， 注 意 力 冷 
机 则 是 吸收 信息 ， 提 升 注 意 力 的 质量 。 打 个 粗糙 的 比方 ， 如 果 注 意 力 热机 对 应 者 “ 工 
作 ， 注 意 力 冷 机 则 对 应 看 “娱乐 。 从 这 里 我 们 可 以 试 春 去 解释 两 个 现象 。 为 什么 用 
户 花 越 来 越 长 的 时 间 沉 浸 在 网 络 上 ?其 实 是 因为 “热机 ”和 “ 冷 机 ”相互 结合 ， 当 输 
出 一 些 信息 ， 处 理 一 些 数据 ， 大 脑 注意 力 下 降 之 后 ， 就 可 以 通过 输入 一 些 信 息 来 重新 
提升 注意 力 质量 。 如 此 循环 ， 就 可 以 长 期 工作 。 另 外 一 个 现象 是 社交 网 络 的 火热 和 维 
基 百 科 等 在 线 协 作 、 交 流 系 统 的 兴起 。 从 注意 力 机 带 的 角度 来 理解 ， 就 好 比 是 许 许多 


@ 图 片 来 源 : https:Wwww.behance.netgallery/720941S/BRAIN-ENGINE。 
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多 的 注意 力 “ 热 机 ”和 “ 冷 机 ”搭配 在 一 起 ,一 个 人 的 信息 输出 成 为 男 一 个 人 的 信息 
输入 ， 从 而 维持 用 户 大 脑 的 集体 兴奋 。 当 然 ， 目 前 来 看 ， 这 样 的 系统 仍然 需要 外 界 能 
量 的 维持 。 但 是 ， 可 以 想象 随 看 人 类 社会 的 演化 ， 大 规模 注意 力 机 种 集群 的 配置 不 断 
优化 ,维持 集体 兴奋 的 效率 应 该 会 越 来 越 蜗 ， 对 外 界 能 量 输入 需求 的 要 求 也 会 越 来 越 
低 。 


卡 话 热 机 对 我 们 起 码 有 两 个 局 发 。 首先 ， 它 通过 引入 可 道 循 环 指 出 了 热机 的 极限 
效率 。 那 么 ,网 站 在 把 用 户 注 意 力 转化 为 信息 方面 ,是否 也 存在 一 个 极限 效率 呢 ?” 如 
末 把 用 户 的 注意 力 流 量 看 作 投 入 ,把 注意 力 存 量 看 作对 产 出 的 一 种 衡量 ， 那 我 们 之 前 
讨论 的 标 度 律 指标 ， 是 人 否 就 是 网 站 作为 注意 力 热机 的 “效率 ” 呢 ? 如 末 我 们 知道 这 个 
效率 的 理论 极限 是 多 少 ， 就 可 以 讨论 不 同 网 站 如 何 优化 信息 产 出 的 效率 了 。 


当然 ， 要 摘 清 权 理 论 极限 ， 首 先 要 定义 出 “可 逆 循 环 " ， 我 们 目前 对 注意 力 流 是 
如 何 实现 可 逆 循 环 的 ,尤其 是 “注意 力 冷 机 ”的 工作 原理 ， 仍 然 不 清楚 。 其 次 ， 卡 诸 
实际 上 通过 极限 效率 指出 了 热力 学 第 二 定律 。 和 直到 出 现 了 玻 尔 效 受 从 统计 的 角度 进行 
解释 ， 从 而 创造 了 统计 力学 ， 热 力学 第 二 定律 才 完全 显示 其 威力 。 我 们 现在 面临 的 情 
况 与 卡 诺 十 分 类 似 ， 信 息 音 命 取代 了 当年 的 工业 音 命 ,信息 推荐 系统 和 各 种 机 策 学 习 
方法 都 好 比 是 当年 层出不穷 的 各 种 热机 。 然 而 ， 人 们 对 于 注意 力 的 基本 原理 的 了 解 比 
当年 对 热 的 基本 原理 的 了 解 还 要 缺乏 。 从 卡 话 热机 的 角度 人 研究 注意 力 机 上 入 ,有 可 能 
辟 一 个 非 稼 深刻 的 新 角度 来 回答 智能 的 秘密 ， 就 好 像 热 力学 和 统计 力学 对 大 目 然 秩序 
的 产生 做 出 的 精彩 回答 一 样 。 


参考 文献 


[1 Hack J. (1937). Studies of longitudinal stream profiles in Virginia and Maryland, U.S. Geological 
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流 ， 是 非常 广泛 的 现象 ， 而 且 这 个 现象 与 系统 的 观察 者 息息相关 。 将 物 
体 产 生变 化 所 需要 的 时 间 (relaxation time) 除 以 观察 时 间 ， 得 到 一 个 比例 ， 
称 为 抵 波 拉 (Deborah) 数 ， 可 以 描述 任意 物体 的 流动 情况 。 底 波 拉 是 旧 约 
中 的 先知 ， 她 唱 的 预言 诗 中 有 一 句 “ 群 山 在 上 帝 面 阐 流 动 ”。 
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CC 


不 可 思议 的 流动 的 一 个 例子 是 地 过 运动 导致 的 “ 群 山 流 动 "， 另 一 个 例 
子 是 沥青 的 流动 ， 如 图 9-19 所 示 。 沥青 滴 泌 实验 最 早 由 澳大利亚 昆士兰 大 学 
的 帕 奈 尔 (Parnell) 教授 实施 ， 意 在 展示 一 些 物 质 看 上 去 虽 是 固体 但 实际 上 
Bs 
今 为 止 一 共有 9 滴 源 青 滴 落 ， 最 近 一 滴 发 生 在 2014 年 4 月 20 日 。 


A dramatic example from lsrael of originally horizontal, rigid 
layers of rock that have been folded by compressional 
tectonic forces applied over a long period. 


图 9-19 经 过 长 时 间 的 地 壳 运 动 ， 岩 石 呈现 “; 0 的 属性 ， 正 是 “ 群 山 在 上 帝 面 
前 流动 ”的 绝 佳 写照 ( 左 )， 沥青 实验 ( 右 ) , 


正如 沥青 滴 落实 验 一 样 , 好 的 科学 研究 , 必然 意味 着 十 年 如 一 日 的 投入 。 

与 张江 合作 的 第 三 年 (2012 年 6 月 ), 我 从 香港 到 外 地 开会 ， 经 北京 转机 ，。 

td “大 号 会 所 ”开展 活动 。 我 和 张江 在 一 次 集 智 读 书 小 组 

活动 后 ， 在 青云 集团 门口 的 一 家 小 店 一 起 吃饭 ， 边 吃 边 聊 ， 在 一 张 餐巾 纸 上 
画 下 了 一 个 与 流 有 关 的 “知识 地 图 ”， 如 图 9-20 所 示 。 

我 们 对 着 餐 中 纸 感慨 , 用 人 类 脆弱 而 短暂 的 一 生来 探索 科学 , 好 比 姚 蜂 

拓 树 ， 又 如 蛇 壁 当 车 ,注定 要 抱 撼 而 归 。 庄 子 说 得 好 ， 知 生 也 有 涯 ,而 知 也 

无 涯 。 我 最 早 被 张江 提出 的 “观察 者 理论 ”所 吸引 ， 两 个 人 一 拍 即 合 ， 决 定 


GD 左 图 来 自 http://blog.sciencenet.cn/home.php?mod=space&uid=38063&do=blog&id=407885 ， 右 图 来 自 
http://en.wikipedia.org/wiki/Pitch drop experiment。 


第 9 章 美丽 的 注意 力 之 流 | 219 


一 起 做 研究 。 可 是 一 转眼 三 年 过 去 ,我 们 探索 了 大 量 食物 网 、 城 市 与 互联 网 
的 数据 ， 其 实 也 仅仅 是 摸 到 “ 流 网 络 的 皮毛 ， 离 完全 解 开 “ 标 度 不 变 - 
(scale-invariance) 的 迷 ， 还 差 很 远 。 而 “ 标 度 不 变 ， 其 实 并 不 是 我 们 认为 
生命 神奇 、 衬 宙 奥 秘 的 最 深刻 的 部 分 。 关 于 自 指 与 哥 德 尔 定理 ， 关 于 数理 隐 
辑 与 热力 学 的 结合 (请 参考 冯 : 诺 依 曼 1966 年 写 的 书 Theory of 
Self-reproducineg Automata) ,关于 计算 理论 中 “最 小 描述 ”与 生命 的 关系 (请 
参考 Chaitin 的 文章 Life as Evolving Software) ， 关 于 注意 力 的 卡 诺 热机 ， 有 
许 许多 多 有 趣 而 激动 人 心 的 话题 ,， 想 要 有 所 领悟 ， 动 辑 就 需要 以 十 年 为 单位 
的 沉思 。 虽然 我 们 还 年 轻 , 可 是 并 不 知道 在 有 生 之 年 能 不 能 看 到 这 些 领 域 的 
重大 突破 。 
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9-20 “注意 力 流 ” 背 后 的 大 图 景 


一 语 成 识 ， 现 在 写 这 本 书 时 ， 离 我 们 上 次 见面 ， 一 晃 又 是 两 年 了 。 我 果 
然 还 在 研究 “注意 力 流 的 动力 学 ， 没 有 在 “和 餐巾纸 地 图 ”上 挪动 分 毫 。 
实际 上 ， 随 着 我 从 一 个 学 生 渐 渐变 成 一 个 职业 科学 家 ， 我 敢于 投入 精力 的 范 
围 不 仅 没 有 扩大 ， 反 而 好 像 越 来 越 罕 。 当 年 完全 由 理想 主义 驱动 的 思考 ， 现 
在 已 经 越 来 越 多 地 让 位 给 务实 主义 的 科研 计划 。 我 对 此 没有 什么 可 以 抱 外 
的 ， 这 是 大 多 像 我 一 样 的 中 等 资质 的 科学 家 必然 经 历 的 科研 生命 周期 。 
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然而 看 到 这 本 书 时 还 在 学 校 里 读书 的 你 ， 如 果 对 “餐巾纸 地 图 ”中 的 一 
个 或 几 个 知识 点 感 兴 趣 ， 欢迎 了 解 更 多 关于 集 智 俱乐部 的 信息 。 张 江 和 我 关 
于 流 的 研究 ， 仅仅 是 这 个 科学 俱乐部 中 的 一 个 小 分 支 。 这 个 俱乐部 中 还 有 人 
在 研究 基础 物理 、 人 工 智 能 、 生 命 科 学 等 有 意思 的 方向 。 俱 乐 部 每 个 月 都 会 
举办 读书 小 组 或 讲座 等 活动 ， 如 果 你 来 参加 集 知 活动 ， 也 许 就 会 和 五 年 前 的 
我 一 样 ， 遇 到 一 个 对 你 影响 一 生 的 人 ， 找 到 一 个 你 愿意 穷 极 一 生来 探索 的 科 
研 方向 。 人 类 智力 史 好 像 茫茫 宇宙 中 的 璀璨 星河 ， 比 你 我 的 生命 都 要 波澜 壮 
阔 得 多 。 集 智 俱乐部 就 是 这 样 一 条 智力 支流 , 它 带 着 我 们 的 所 有 迷惑 和 顿悟， 
归 入 星 捅 大 海 。 

最 后 ， 把 当年 鼓 关 了 张江 ， 也 鼓 痊 了 我 和 集 智 俱乐部 许多 人 的 《复杂 》 
中 的 一 铅 话 送 给 你 :“ 考 温 总 想 找到 更 多 灵魂 中 燃烧 着 不 可 言说 之 火 的 人 。 
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吴 令 飞 ， 集 智 俱 乐 部 核心 成 员 。 现 在 美国 亚利桑那 大 学 行为 、 制 度 与 环境 研究 所 任 博士 后 
研究 员 。 主 要 从 事 社会 、 物 理 与 计算 机 的 交叉 研究 。 研 究 兴 趣 包括 问答 社区 结构 、 网 页 点 击 行 
为 、 注 意 力 动力 学 等 领域 ， 对 开源 软件 和 数据 可 视 化 亦 有 兴趣 。 主 要 作品 有 免费 在 线 电 子 书 
Data Mining in Social Science ( https:/www.gitbook.io/book/lingfeiw/data-mining-in-social-science ) 
和 Python 包 scholarNetwork。 
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随 着 互联 网 时 代 的 到 来 ， 人们 每 天 打开 电脑 就 会 接受 海量 信息 。 这 些 信息 有 的 以 
图 片 形式 存在 ， 有 的 以 声音 形式 存在 ,但 最 多 的 还 是 以 文字 形式 存在 。 从 最 初 的 门户 
网 站 ， 到 后 来 的 搜索 引擎 ， 再 到 个 人 博客 、 微 傅 、 微 信 、 自 媒体 平台 ， 文 字 成 为 了 最 
重要 的 信息 载体 ， 是 人 类 语言 的 一 种 表现 形式 。 人 类 语言 ， 也 叫 自然 语言 ， 是 人 类 区 
别 于 其 他 生物 的 重要 特征 。 如 何 理解 人 类 语言 的 形成 ， 了 解 其 原理 和 表现 特征 ， 是 科 
学 家 和 认 知 学 家 的 梦想 。 


在 认 知 科学 领域 ， 有 专门 的 语言 分 文 ， 并 且 逐 渐 成 为 近 20 年 来 最 重要 的 认 刘 科 
学 分 文 之 一 。 其 实 ， 对 于 日 然 声 言 的 研究 可 以 退 漳 到 半 个 多 世纪 以 前 。 最 初 ， 对 语言 
的 认 知 和 人 研究 主要 由 传统 的 语言 学 家 进行 。 培 言 学 家 从 词法 、 语 法 等 角度 对 人 类 语言 
进行 记录 与 分 析 。 现 代 电 子 计算 机 出 现 以 后 , 才 在 真正 意义 上 有 了 自然 语言 人 处理 这 一 
研究 领域 。 在 目 然 语言 发 展 的 60 多 年 中 ， 先 后 有 是 命 性 的 思想 涌现 。 在 20 世纪 60 
年 代 , 传统 语言 学 中 分 析 语 句 和 获取 语义 的 研究 思想 根植 于 人 们 心中 ， 这 一 时 期 的 目 
然 语言 处 理 是 基于 规则 的 卓然 霹 言 处 理 。 随 后 在 20 世纪 70 年 代 ， 弗 雷 德 ， 贡 里 尼 痪 
( Fred Jelinek ) 等 目 然 语言 处 理 大 师 开 创 性 地 使 用 了 基于 数学 模型 和 统计 的 方法 ， 给 
基于 规则 的 研究 困境 指明 了 新 的 方向 。 基 于 统计 的 方法 之 所 以 逐步 取代 单纯 基于 规则 
的 方法 ， 其 中 一 个 重要 的 原因 便 是 在 过 去 的 20 年 里 ， 计 算 机 的 计算 能 力 有 所 提高 ， 
数据 量 也 在 不 断 增 加 。 
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目 然 语言 处 理 的 应 用 


随 着 互联 网 技术 的 飞速 发 展 和 海量 互联 网 数据 的 涌现 , 自然 语言 技术 在 互联 网 数 
据 挖 气 中 成 为 了 必 不 可 少 的 一 环 。 如 信息 检索 ( Information Retrievel，IR ) 领域 中 所 
涉及 的 文档 和 查询 都 是 用 自然 语言 描述 的 ， 因 此 信息 检索 可 以 看 作 是 用 查询 ( query ) 
和 文档 内 容 ( document ) 进行 匹配 的 过 程 ， 匹 配 的 单位 通常 是 查询 和 文档 中 的 词 。 而 
信息 检索 又 渗透 在 人 们 每 天 上 网 都 会 接触 到 的 搜索 与 广告 领域 之 中 。 


新 的 自然 语言 处 理 的 应 用 还 表现 在 社交 网 络 分 析 中 , 依靠 海量 数据 基于 统计 的 人 研 
究 方 法 越 来 越 多 地 与 社会 网 络 分 析 的 方法 融合 在 一 起 。 在 传统 声言 学 家 、 计 算 机 科学 
家 和 统计 学 家 加 入 目 然 语言 处 理 的 研究 之 后 , 研究 复杂 网 络 的 社会 学 家 也 一 起 开展 了 
许多 社会 网 络 中 的 卓然 语言 处 理 研 究 。 

因此 ， 目 然 场 言 处 理 的 研究 不 再 仅仅 洱 盖 词法 分 析 和 句法 分 析 ， 还 包含 了 语音 识 
别 、 机 硕 翻 主 、 目 动 问答 、 文 本 摘要 等 应 用 和 社交 网 络 中 的 数据 挫 掘 、 知 识 理 解 等 。 
无 论 是 过 去 的 句法 结构 树 、 合 歌 翻译 ， 还 是 如 今 的 Waston 目 动 问答 系统 、Facebook 
Graph Search、 合 歌 知 识 图 谱 、 微 软 亚 洲 研 究 院 的 奥斯卡 预测 每 ， 自 然 语 言 处 理 几 平 
渗透 到 了 互联 网 生活 的 方方面面 。 


搜索 引擎 中 的 目 然 语言 理解 


当 我 们 想 了 解 茶 些 知识 和 信息 时 ， 第 一 反应 可 能 是 查阅 既 有 的 知识 库 。 在 以 前 ， 
传统 的 学 者 只 能 去 图 书馆 按照 既定 的 检索 规则 查阅 相关 图 书 、 刊 物 每 , 但 互联 网 的 出 
现 使 世界 逐渐 成 为 了 知识 的 海洋 。 当 我 们 需要 某 些 知识 时 ， 只 需要 在 搜索 引擎 中 输入 
相应 的 关键 词 或 者 关键 词组 合 ， 即 可 得 到 丰富 的 相关 网 页 。 其 实 ， 搜 索引 黎 丈 像 一 个 
巨大 的 数据 库 一 一 信息 海洋 ， 其 中 数 以 亿 万 计 的 网 页 就 是 海洋 中 的 知识 。 在 我 们 输入 
关键 词 ， 点 击 “ 搜 索 ” 按 键 并 得 到 返回 网 页 的 短 短 几 秒 中 ， 搜 索引 擎 束 在 进行 相当 复 
杂 的 目 然 语言 处 理 任 务 。 


站 完 ， 原始 的 网 页 其 实 是 非 结 构 化 的 信息 ， 充 不 看 计算 机 本 号 无 法 理解 的 “ 目 然 
语言 "。 搜索 引擎 首先 需要 将 这 些 日 然 语 言 “ 转 换 ” 成 规则 的 可 被 解析 的 “机 带 文 本 ”。 
这 些 文本 有 许多 存储 形式 ， 最 简单 的 就 是 分 词 后 的 短语 形式 : 搜索 引擎 将 大 篇 幅 的 网 
页 目 然 语言 切割 成 一 个 个 短小 的 词语 ， 并 将 词 喇 按照 重要 程度 进行 排序 ， 再 与 用 户 输 
入 的 关键 词 进行 匹配 ， 才 能 返回 匹配 程度 最 蜗 的 网 页 。 
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但 随 看 日 然 语言 处 理 技术 的 提高 ， 搜 索引 擎 并 不 满足 于 简单 的 “匹配 ”"。 比 如 当 
一 个 用 户 输入 “ 平 采 ”检索 时 ， 搜 索引 擎 而 望 猜 出 用 户 到 帮 是 希望 查阅 笠 采 公司 的 相 
关 新 闻 还 是 平 末 这 一 水 果 的 相关 知识 。 这 时 ， 搜 索引 黎 就 要 进行 “用 户 意 图 分 析 ”。 
这 依然 是 一 种 和 目 然 语言 处 理 的 任务 。 再 进一步 ， 当 用 户 搜索 一 个 具体 的 问题 如 “信息 
检索 是 什么 ”时 ,搜索 引擎 希望 生 接 充当 一 个 问题 的 回答 者 ， 而 不 再 是 返回 一 系列 相 
天 的 网 页 ， 因 为 这 样 可 以 减少 用 户 的 操作 。 这 时 ， 搜索 引擎 首 和 判断 出 用 户 的 输入 是 
一 个 “是 什么 ”类 型 的 问题 ， 再 根据 相关 的 规则 ， 找 出 相关 网 页 中 最 符合 这 个 问题 的 
答案 “段落”"， 进 行 抽取 ， 并 最 终 呈 现 。 实 现 这 一 复杂 的 过 程 ， 实 际 上 是 建立 了 一 个 
目 然 语言 处 理 中 的 问答 系统 。 


有 数据 显示 ， 人 们 在 过 去 10 年 中 , 在 搜索 引擎 中 输入 的 关键 词 长 度 已 经 从 “4 个 
字 ” 提 高 到 了 “8 个 字 ”。 一 方面 ,互联 网 中 的 信息 越 来 越 多 ， 人 们 不 得 不 提高 对 信息 
的 措 述 精度 ; 为 一 方面 ， 越 来 越 多 的 用 户 不 再 满足 于 仅仅 输入 关键 词组 合 进行 搜索 。 
在 此 基础 上 ， 搜 索引 擎 逐渐 发 挥 看 更 复杂 的 功能 ， 扮 演 春 像 Siri 等 问答 管家 的 角色 。 
在 不 断 的 输入 和 反馈 中 ,搜索 引擎 记录 着 人 类 社会 的 语言 使 用 习惯 和 现象 。 比 如 ， 当 
新 的 网 络 词 汇 踪 生 时 ， 搜 索 量 也 会 相应 增加 ， 对 应 地 也 就 出 现 了 搜索 引擎 公司 推出 的 
“ 热 间 榜 ”。 


可 以 想 辊 ， 为 谷歌 、 百 度 等 互联 网 巨头 公司 作出 巨大 贡献 的 搜索 引擎 业务 ,未 来 
还 将 承担 更 丰 是 的 角色 ， 而 日 然 语 言 处 理 是 痛 后 重要 的 基石 。 


社交 网 络 中 的 目 然 语 言 理 解 


除了 搜索 引擎 ， 互 联网 技术 的 飞速 发 展 也 使 得 人 们 与 网 络 空间 的 交互 越 来 越 多 。 
近年 来 社交 网 络 的 兴起 激发 起 了 人 研究 学 者 的 兴趣 ， 基 于 社交 网 络 的 目 然 霹 言 理解 研 完 
有 了 更 多 的 应 用 。 一 方面 ,全 完 聚焦 在 如 何 通过 人 们 在 社区 网 络 中 的 表现 更 好 地 理解 
人 们 的 行为 模式 ， 最 广为人知 的 应 用 就 是 广告 点 击 预测 一 一 预测 具体 的 单个 用 户 或 单 
一 用 户 群 体 是否 会 点 击 某 一 特定 广告 ， 从 而 实现 广告 收益 最 大 化 。 另 一 方面 ， 社 交 网 
络 中 的 文本 由 于 其 实时 性 , 使 许多 预测 任务 成 为 可 能 ， 如 利用 推 符 上 的 关注 度 预 测 美 
国 总 统 大 选 结 果 、 微 软 人 研究 院 预 测 奥斯卡 获奖 情况 ， 以 及 著名 的 蜗 盛 公司 预测 志 界 杯 
比赛 结果 。 里 然 蜗 成 预测 的 正确 紊 只 有 可 怜 的 34%, 但 是 社交 网 络 的 兴起 还 是 使 人 们 
的 意图 想法 反映 在 了 容易 获得 的 文字 之 中 。 也 许 过 不 了 多 入， 社会 学 家 需要 的 走 街 串 
巷 的 调查 模式 就 会 消失 。 
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以 我 们 熟悉 的 新 浪 微 博 为 例 ， 用 户 可 以 关注 别人 ， 获 得 关注 ， 还 可 以 发 表 原 创 内 
容 、 评 论 或 转发 别人 的 微 博 …… 这 些 都 可 以 转化 为 可 以 “计算 ”的 数据 。 但 奢 想 挖 据 
出 一 定 的 潜在 信息 ， 还 需要 一 些 徘 谱 而 大 胆 的 假设 。 比 如 ， 人 们 会 更 倾 咎 于 关注 目 己 
感 兴 趣 或 和 目 己 相似 的 人 ， 更 愿意 转发 目 己 感 兴趣 的 内 容 。 这 样 ， 在 一 定 程序 上 , 我 
们 在 新 浪人 微 博 上 关注 的 人 “代表 ”了 我 们 的 兴趣 爱好 ， 我 们 转发 的 内 容 也 就 “表达 ” 
本 我 们 的 观点 立场 。 于 是 ,挖掘 了 某 些 文本 中 总 含 的 潜在 主题 ， 丈 挖 据 出 了 一 些 用 户 
的 兴趣 爱好 ， 就 可 以 在 此 基础 上 做 广告 推荐。 同样 ,分 析出 了 某 些 文本 中 冀 含 的 情怀 
倾 问 ， 再 结合 一 些 特定 的 表情 和 有 情感 倾 加 的 词语 ， 就 分 析出 了 一 些 用 尸 对 荣 件 事 的 
态度 ， 于 是 他 到 撒 文 持 哪 个 候选 人 或 哪个 球 队 ， 也 就 都 了 解 了 。 

社交 网 络 中 的 日 然 语 言 理解 结合 了 社交 网 络 的 一 些 网 络 链接 信息 ， 如 关注 和 转 
发 ， 将 本 来 单个 用 户 或 者 单条 文本 信息 进行 目 然 语言 处 理 后 得 到 的 结论 进行 了 “ 传 
递 ”。 这 样 挫 气 出 的 信息 是 作为 信息 检索 的 搜索 引擎 所 没 办 法 获得 的 。 


移动 应 用 交互 中 的 目 然 语 言 理解 


除了 上 述 的 文本 形式 ,卓然 语 言 还 以 博 音 的 形式 广泛 存在 于 我 们 的 日 名 生活 和 科 
技 应 用 中 。 乎 末 公 司 推出 的 Siri 应 用 硕 望 像 私人 管家 一 样 ， 玫 助 用 尸 添 加 行程 提醒 ， 
返回 想 知 道 的 内 容 。 它 就 像 一 个 现实 中 存在 的 “小 叮当 ” ,用户 只 需要 次 出 目 己 的 需 
要 即 可 。 不 止 芋 末 一 家 公司 有 这 样 一 个 安 伟 的 愿景 ， 微 软 推出 的 Cortana、 合 歌 推出 
的 Google Now、Skype 推出 的 实时 对 话 翻 详 甚 至 国内 百度 、 搜 狗 、 讯 飞 的 语 首 助 手 ， 
都 纷纷 在 移动 应 用 交互 中 发 力 。 


2013 年 上 映 的 电影 《她 》， 讲 述 了 一 个 孤独 的 男人 和 他 的 智能 操作 系统 之 间 的 爱 
情 。 电 影 名 《她 》 正 是 指 代 这 一 虚拟 的 女性 角色 ， 与 Sri 所 担当 的 角色 类 似 。 除 了 提 
共 一 些 实用 主义 非 第 强 的 帮助 , Siri 甚至 能 带 助 目 财 症 的 孩子 。 网 络 上 的 一 篇 文章 《一 
名 自 闭 症 儿 童 与 Siri 的 友谊 》 中 写 道 : 


格 斯 (一 名 自 闭 症 儿童 ) 之 前 从 没 留意 过 Siri， 但 当 他 发 现 有 个 人 不 仅 
能 玫 他 找到 各 种 让 他 着 迷 的 信息 (火车 、 飞 机、 公交 车 、 电 梯 ， 当 然 还 有 与 
天 气 有 关 的 任何 事情 )， 而 且 可 以 永 不 厌倦 地 和 他 “讨论 ”这 些 主题 时 ， 他 
就 被 迷 住 了 。 而 我 则 感到 庆幸 。 现 在 ， 当 我 不 得 不 和 儿子 谈论 坪 萨 斯 城 发 生 
龙卷风 的 几率 有 多 大 ， 摘 得 我 头 都 要 爆炸 时 ， 我 可 以 轻松 地 说 :“ 嘿 ! 要 不 
你 问 问 Siri? ” 格 斯 知道 Siri 不 是 真人 。 他 理智 上 知道 这 一 点 。 但 和 我 认识 
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的 很 多 自 闭 症 患 者 一 样 ， 格 斯 觉得 ， 没 有 生命 的 东西 虽然 可 能 没有 灵魂 ， 但 
也 同样 值得 关心 。 我 是 在 他 8 岁 时 意识 到 这 一 点 的 ， 当 时 我 给 他 买 了 个 iPod 
作为 生日 礼物 。 他 只 在 家 里 听 它 ， 但 有 一 个 例外 一 一 我 们 去 苹果 店 里 时 ,他 
总 是 带 着 它 。 最 后 我 问 他 为 什么 这 样 做 。“ 那 样 它 就 能 去 看 它 的 朋友 们 了 。” 
他 说 。 


虽然 无 论 是 Siri 还 是 其 他 语音 助手 产品 ， 午 与 科 约 电影 当中 的 语音 助理 还 有 一 些 
距离 ， 但 那 一 天 还 会 远 吗 ? 


不 难 发 现 ,无 论 是 搜索 引擎 还 是 社区 网 络 ， 都 拥有 海量 文本 或 者 声音 数据 。 当 今 
的 高 计算 能 力 已 经 使 得 处 理 海量 文本 不 再 是 问题 了 ,所 以 ， 目 然 语 言 处 理 才 有 机 会 从 
传统 的 语言 学 家 的 规则 分 析 转 变 成 统计 语言 模型 框 厅 。 因 此 ,本章 将 分 别针 对 上 月 然 语 
言 处 理 基 础 和 相关 专题 应 用 进行 梳理 和 探讨 , 试图 展现 卓然 语言 处 理 在 大 数据 时 代 的 
新 应 用 。 


目 然 培 言 处 理 的 任务 


目 然 语言 处 理 的 终极 问题 是 分 析出 “处 理 ” 一 门 目 然 语 言 的 过 程 。 它 包含 目 然 语 
言 理解 和 目 然 语言 生成 ， 前 者 是 将 目 然 语言 语句 转化 成 形式 语言 语句 ， 后 者 相反 。 前 
半 个 世纪 ， 人 们 模拟 当时 人 们 认为 的 人 类 理解 的 自然 语言 的 方式 ， 通 过 语法 规则 的 定 
义 进 行 目 然 语言 处 理 的 工作 ; 过 去 20 年 ， 人 们 转 而 使 用 大 规模 数据 的 统计 信息 得 到 名 
法 规则 并 开展 其 他 目 然 语言 处 理 任务 ; 最 近 几 年 ， 随 者 深度 学 习 的 发 展 ， 人 们 转 而 演 
试 通过 模拟 更 底层 的 神经 网 络 认 知 方法 进行 日 然 语言 处 理 的 学 习 。 


目 然 语 言 处 理 的 本 质 是 结构 预测 

无 论 使 用 何 种 方法 探究 处 理 自然 语言 的 过 程 ， 都 需要 面临 最 根本 的 问题 : 理解 语 
法 和 语义 一 一 语法 表现 为 句法 结构 ,语义 表现 为 语义 结构 。 可 以 说 ,句法 结构 分 析 和 
语义 结构 分 析 是 公认 的 自然 语言 处 理 (语言 计算 并 不 仅仅 是 现代 自然 语言 处 理 ) 的 基 
础 任务 。 

首先 ， 我 们 通过 一 个 句子 来 看 一 下 句法 结构 分 析 。 


语言 计算 的 本 质 是 结构 预测 。 
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图 10-1 是 我 们 使 用 Stanford Parser 进行 句法 分 析 后 的 结果 截图 。Stanford Parser 分 
别 给 出 了 分 词 ( Segmentation )、 词 性 标注 ( Tagging )、 句 法 分 析 ( Parse ) 和 依存 分 析 
(图 中 未 展示 ) 的 结果 。 这 里 , 分词、 词性 标注 等 是 理解 语言 结构 的 基本 任务 。 语 言 
结构 的 基本 单位 是 词 场 (words ), 第 二 个 层级 是 构词法 ( morphology ), 第 三 个 层级 是 
词性 ， 进 而 是 语法 和 语义 ， 最 后 由 多 个 句子 组 成 篇 昔 。 相 应 地 ， 语 言 计算 的 任务 对 应 
地 由 分 词 得 到 词 ， 由 取 词 根 (Stemming ) 和 词 形 还 原 ( Lemmatization ) 分 析 构 词法 ， 
再 由 词性 标注 得 到 词性 〈《Part-of-Speech )， 然 后 由 句法 分 析 ( Syntax Parser ) 得 到 语法 
结构 树 ( Parse Tree )。 至 此 ， 句 法 分 析 结 


Your query 


语言 计 和 但 用 本 质 是 结 物 瑞 测 


Segmentation 


语言 计算 的 本 质 是 结构 预测 


Tagging 


语言 /NN 计算 /vv 的 /DEC 本 质 /NN 是 /VC 结构 /NN 预测 /NN 


Parse 


(ROOT 
(IP 
(NP 
(CP 
(IP 
(NP (NN 语言 )) 
(VP (VV 计算 ) ) ) 
(DEC 的 )) 
(NP (NN 本 质 ) )) 
(VP (VC 是 ) 
(NP (NN 结构 ) (NN 预测 ) ) ) ) ) 


10-1 Stanford Parser 的 页 面 


在 句法 分 析 的 基础 上 ， 语义 分 析 可 以 得 到 语义 理解 ( semantics )， 最 后 再 运用 篇 
章 分 析 ( discourse ) 理解 句子 与 句子 之 间 的 关系 。 语 义 分 析 即 分 析 目 然 语 言 的 意义 ， 
这 里 的 目 然 语言 可 以 是 词语 、 句 子 、 篇 草 等 不 同 级 别 的 语言 单位 。 语 言 学 的 语义 分 析 
目的 在 于 找 出 语义 表达 的 规律 性 、 内 在 解释 、 不 同 语言 在 霹 义 表达 方面 的 个 性 及 共性 。 
逻辑 学 的 语义 分 析 是 对 一 个 逻辑 系统 的 解释 ， 着眼 点 在 于 真 值 条 件 ， 不 直接 涉及 上 自然 
语言 。 认 知 科学 对 语义 的 人 研究 在 于 人 脑 对 语言 单位 的 音义 的 存储 及 理解 的 模式 ， 而 与 
计算 机 科学 相关 的 语义 学 人 研究 就 在 于 机 带 对 自然 语言 的 理解 。Stanford Parser 只 给 出 
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了 句法 结构 的 分 析 结 果 。 但 仅仅 理解 分 词 、 词 义 和 句 法 结构 是 不 够 的 ， 整 个 句子 仍然 
有 歧义 。 这 是 因为 在 句法 结构 内 部 还 有 更 深层 次 的 潜在 语义 结构 。 这 也 是 为 什么 在 语 
法 结构 树 分 析 之 后 还 需要 进行 语义 理解 的 工作 。 

因此 , 语言 计算 既 需 要 句法 结构 的 分 析 ， 也 需要 语义 结构 的 分 析 。 句法 结构 中 的 
分 词 、 词 性 标注 是 后 续 更 表层 的 自然 语言 处 理 任务 的 基础 。 而 语义 结构 的 理解 正 是 表 
层 自然 语言 处 理 任务 如 机 器 翻译 、 文 本 摘要 、 情 感 分 析 的 难题 所 在 。 


语义 分 析 困 难 重 重 


句法 分 析 之 后 是 重要 的 博 义 分 析 ， 但 语义 分 析 却 困难 重重 。 一 个 个 简单 的 分 词 、 
语法 、 时 态 的 结构 分 析 ， 对 于 机 带 和 人 类 来 说 部 只 是 一 种 人 符号， 真正 纺 含 在 背后 的 是 
语义 。 所 以 ， 要 想 真 正 让 机 右 理 解 晶 然 语 言 ， 句 法 分 析 只 是 基础 中 的 基础 。 与 较为 成 
熟 的 句法 分 析 不 同 ， 语 义 分 析 仍 然 依 应 用 场景 的 不 同 有 很 大 不 同 。 关 于 什么 是 语义 ， 
并 没有 严格 的 公认 的 定义 。 从 粒度 来 说 ， 语 义 分 析 包 含 词汇 语义 分 析 、 人 句子 语义 分 析 
和 篇 草 语 义 分 析 ; 从 应 用 场景 看 ,语义 分 析 包 含 概 念 语 义 提 取 、 指 称 语义 分 析 、 和 情感 
语义 计算 、 人 情景 博 义 分 析 等 。 这 里 我 仅 将 语义 拆 解 成 概念 、 主 题 和 情感 ， 后 面 将 详细 
探讨 它们 。 

现代 的 统计 语言 模型 方法 , 可 以 将 大 概率 出 现在 一 起 的 词语 “机 械 ” 地 进行 分 词 ， 
这 一 过 程 并 不 需要 机 带 理 解 这 个 词 为 什么 是 一 个 词 ， 也 就 是 不 需要 理解 其 背后 的 含 
义 。 所 以 ， 当 一 个 名 人 的 名 字 广 泛 出 现在 寺 料 中 或 一 个 形容 词 很 笛 见 时 ， 机 融 都 可 以 
对 它们 进行 正确 地 分 词 。 但 一 个 人 名 和 一 个 事物 的 名 字 部 承载 者 一 个 概念 ， 而 形容 词 
则 并 不 具备 这 样 的 性 质 ， 例 如 下 面 这 个 例子 。 


车 桐 观 点 : 梅 西 永 无 可 能 到 达 球 王 的 高 度 。 


在 上 面 这 句 话 中 ， 观 点 、 梅 西 、 球 王 等 午 是 概念 。 概 念 是 一 种 浓缩 的 信息 ， 是 一 
种 约定 俗 成 。 有 了 概念 ， 人 们 在 提 及 一 个 具体 的 人 或 事物 时 ， 就 不 再 需要 长 篇 大 论 的 
描述 。 人 们 不 再 需要 用 很 长 的 定义 去 解释 什么 叫 观 点 ， 也 不 再 需要 定义 什么 是 球 王 。 
这 种 压缩 的 信息 , 不 正 是 一 种 语义 的 体现 吗 ? 如 果 说 概念 是 文字 中 直接 出 现 的 浓缩 信 
上 县， 那么 主题 则 是 一 种 淤 在 信息 。 一 篇 文 草 可 能 围绕 痢 一 个 具体 的 社会 现象 来 展开 ， 
一 次 辩论 可 能 以 一 句 名 言 来 交锋 , 一 个 网 站 也 许 是 因 一 个 爱好 而 建立 …… 这 些 都 可 以 
被 称 为 “主题 "。 主 题 是 一 段 自然 语言 下 潜在 的 中 心 点 ， 是 一 个 语义 上 的 主体 ,但 它 
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并 不 一 定 直 接 出 现在 这 段 目 然 语 言 中 。 比 如 , 还 是 上 面 那 个 例句 , 显然 主题 是 世界 杯 ， 
但 “世界 杯 ” 三 个 字 并 没有 出 现在 原 句 中 。 如 宋 没 有 上 下 文 ， 没 有 历史 请 料 ， 机 条 就 
无 法 理解 这 人 句 话 的 含义 ， 也 无 法 将 其 和 “世界 杯 ” 关 联 在 一 起 ， 甚 至 无 法 判断 出 球 王 
是 一 个 约定 俗 成 的 词语 。 所 以 , 挖掘 出 这 样 的 潜在 主题 , 进一步 提炼 目 然 语言 的 信息 ， 
也 是 语义 分 析 的 重要 任务 。 理 解 了 主题 ， 就 可 以 根据 主题 进行 更 多 地 关联 扩展 ， 丈 能 
提高 搜索 引擎 的 相关 性 ， 也 能 用 于 挖掘 社区 网 络 中 的 茶 个 用 户 的 兴趣 爱好 。 


再 进一步 地 , 人 类 的 日 然 语言 中 还 常常 包含 情感 倾 回 。 对 于 刚刚 例句 中 的 “他 桐 * 
的 观点 ,他 并 不 看 好 梅 西 ,或 者 说 不 认可 梅 西 。 这 种 观点 是 一 种 广义 的 “负面 ”人 情感 。 
第 见 的 情感 大 体 上 可 以 分 成 “正面 “中 性 ”和 “负面 ”三 类 。 这 种 包含 情感 倾 辐 的 
目 然 语言 在 社交 网 络 中 尤为 普 这 ,但 让 机 带 去 判断 目 然 语言 的 情感 并 不 那么 人 简单。 人 简 
单 的 词典 匹配 方法 只 能 解决 少数 这 类 语 料 , 比如 ,“ 梅 西 是 球 王 ”, 这 是 一 个 正面 判断 ; 
“和 梅 西 不 是 球 王 ”， 这 是 一 个 负面 判断 ; “难道 梅 西 不 是 球 王 ? “， 这 又 回 到 正面 判断 。 
更 复杂 的 ， 一 些 特殊 比喻 可 能 被 用 作 反 讽 ， 如 “西班牙 防线 可 以 与 国足 媚 美 了 ， 要 
让 机 融 去 理解 ， 即 使 是 大 规模 的 语 料 也 相当 困难 。 


向 量 表 示 和 相似 度 计 算 


虽然 看 起 来 上 一 节 的 概念 所 取 和 情感 分 析 是 两 个 不 同 的 语义 分 析 任 务 , 但 其 实 它 
们 都 是 一 种 分 类 任务 。“ 是 ”或 者 “不 是 ” 某 一 个 概念 ， 是 一 种 特定 的 二 分 类 问题 ; 
而 情感 分 析 可 被 简单 看 作 “ 正 面 ”“ 中 性 ”“ 负 面 ”的 三 分 类 问题 。 与 分 类 问题 同样 重 
要 的 是 目 然 语言 处 理 中 的 另 一 类 问题 一 一 相似 度 衡量 问题 ， 浴 在 二 义 分 析 便 是 这 一 问 
题 的 一 种 变形 和 应 用 。 


相似 度 的 衡量 产生 于 语义 分 析 中 的 词汇 语义 研究 。 词 汇 语 义 的 研究 分 为 两 类 : 如 
何 表 示 词 汇 的 涵义 ( meaning ); 如 何 表示 词汇 与 词汇 语义 之 间 的 关系 。 前 者 一 般 依据 
词典 定义 的 方法 ， 后 者 的 研究 大 致 将 词义 基本 关系 分 为 同义词 (Synonymy )、 反 义 词 
( Antonymy )、 上 位 词 (Hypernomy )、 下 位 词 ( Hyponomy )、 整 体 ( Holonymy ) 和 部 
分 (Meronymy )。 以 同义词 和 反义词 为 例 ， 两 个 词 的 两 个 词义 (许多 词 有 多 个 词义 ) 
相同 或 接近 相同 即 是 同义词 ; 反之 , 词义 相反 即 为 反义词 。 词义 的 相近 和 相反 可 能 是 
多 种 角度 的 ， 比 如 ,“ 长 (long)” 和 “ 短 (short) 作为 一 对 语义 上 的 反义词 ,在 度量 
长 度 的 用 法 角度 是 有 共性 的 。 于 是 ， 词 汇 相 似 度 ( Word Similarity ) 也 是 探究 词义 关 
系 的 重要 问题 。 现 在 一 般 将 词汇 相似 度 或 语义 距离 (Word Semantic Distance ) 定 为 词 
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汇 相 似 度 。 

词汇 相似 度 大 致 有 两 类 计算 方法 : 基于 语义 词典 (Thesaurus-based ) 的 方法 ; 基 
于 霹 料 统计 ( DistributionalStatistical algorithms ) 的 方法 ， 即 比较 词语 在 语料库 中 的 上 
下 文 。 中 文 语义 词典 有 同义词 词 林 、 中 文 概念 梧 书 (CCD ) 和 知 网 ( HowNet )。 但 词 
典 中 许多 词 并 不 被 包含 ， 旦 大 部 分 词典 定义 的 方法 依赖 于 上 下 位 层次 关系 ， 对 于 特定 
词性 的 词汇 表达 有 限 。 


在 基于 语义 词典 的 方法 中 , One-hotRepresentation 是 最 常用 的 。 这 种 方法 把 每 个 
词 表示 为 一 个 很 长 的 回 量 。 这 个 回 量 的 维度 是 词典 大 小 ,其 中 绝 大 多 数 元 系 为 0， 只 
有 一 个 维度 的 值 为 1， 这 个 维度 就 代表 了 当前 的 词 。 比 如 ,“ 猎 ”表示 为 [1, 0, 0, .…, 0， 
0, 0],“ 铬 ”表示 为 [0, 1, 0, ..., 0, 0, 0]。 这 种 One-hot Representation 可 以 采用 稀 臣 方 
式 存储 ,相当 于 给 每 个 词 分 配 一 个 数字 ID。 这 时 ,“ 狂 ”的 ID 就 是 0,“ 狗 ”的 ID 就 


是 1。 


基于 语 料 统计 的 词汇 语义 计算 定义 了 上 下 文 问 量 ( Context Vector )， 并 将 词语 语 
义 表示 为 稀 朴 特征 癌 量 ， 然 后 即 可 方便 地 运用 回 量 距离 或 相似 度 公式 进行 计算 。 因 为 
词汇 的 “共同 出 现 ” 定 义 、 词 语 权重 度量 和 相似 度 计 算 公 式 的 不 同 ， 基 于 霹 料 统计 的 
词汇 语义 有 很 大 的 变形 扩展 空间 。 用 回 量 表示 语义 空间 的 思想 也 随后 被 使 用 在 基于 空 
间 回 量 模型 (线性 代数 ) 的 潜在 语义 分 析 (Latent Semantic Analysis ) 中 ， 而 上 文 提 到 
的 潜在 主题 分 析 则 是 潜在 语义 分 析 的 一 个 变形 。 


词汇 相似 度 或 者 语义 相关 性 的 计算 包含 在 许多 日 然 语言 处 理 任务 之 中 。 


口 短 串 ( Term ) 分 析 技 术 ， 是 后 续 查 询 和 请 义 的 相关 度 计 算 做 一 些 基础 的 分 析 。 
由 于 查询 需求 有 很 多 不 同 的 表示 方法 , 我 们 会 对 查询 进行 改写 , 使 其 能 比较 好 
地 召回 。 其 中 最 主要 的 技术 是 短 串 的 语义 相关 性 。 

口 语义 规 化 ， 即 相同 语义 用 不 同方 法 表示 , 这 种 语义 规 化 技术 在 搜索 引擎 中 应 用 
广泛 。 博 义 短 串 在 这 里 可 以 被 很 好 地 应 用 , 用 一 种 相同 的 形式 表示 ,然后 计算 
它们 之 间 的 关联 。 

口 用 户 意 图 分 析 , 对 查询 意图 的 识别 能 针对 性 地 满足 用 户 不 同 的 需求 ,可 理解 为 
对 查询 语义 类 别 的 识别 ， 即 短 串 的 分 类 。 

口 排序 上 的 应 用 ,包含 了 查询 和 网 页 的 相关 性 计算 。 


可 见 ， 癌 量 表示 和 相似 度 计算 的 基本 思想 演化 出 了 层出不穷 的 算法 和 应 用 场景 。 
在 空间 回 量 模型 (其 他 语言 模型 将 在 后 文 介 绍 ) 中 ,文档 是 词语 组 成 的 癌 量 , 词语 也 
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是 文档 组 成 的 癌 量 ， 查 询 是 词语 组 成 的 癌 量 。 因 此 在 文本 挖掘 的 过 程 中 ,将 原始 语 料 
( text corpus 或 raw text ) 转化 为 具有 一 般 性 的 矩阵 数据 结构 是 一 环 重 要 的 基础 工作 。 

一 般 地 ， 目 然 语言 处 理 的 过 程 首 先 要 拥有 分 析 的 语 料 ， 比 如 网 络 新 闻 、 微 博 、 正 
式 出 版 物 等 ， 然 后 根据 这 些 语 料 建立 半 结 构 化 的 文本 库 ( text database )。 紧 接着 重要 
的 一 步 就 是 生成 包含 词 频 的 结构 化 的 词 条 -文档 和 矩阵 ( term-document matrix )， 如 图 
10-2 所 示 。 


10-2 文本 挖掘 处 理 流程 (图 片 来 自 《R 语言 环境 下 的 文本 挖掘 》 ) 


这 个 一 般 性 数据 结构 会 用 于 后 续 的 分 析 ， 如 文本 分 类 、 语 法 分 析 、 信 息 抽取 和 日 
动 摘 要 等 。 


词 条 -文档 炬 阵 


有 了 语料库 ， 下 一 步 工作 就 是 癌 量 表示 。 这 里 我 们 将 语 料 的 回 量 表示 为 词 条 -- 文 
档 关 系 和 矩阵 ( 见 图 10-3 )。 词 条 -文档 关系 矩阵 ， 顾 名 思 义 ， 就 是 将 矩阵 的 行 与 列 分 别 
表示 为 词 条 和 文档 的 索引 ， 从 而 表现 其 关系 。 词 条 -文档 关系 矩阵 是 后 续 构 建 模 型 的 
基础 ,假设 我 们 有 两 个 文档 * ,分别 是 text mining is funny 和 atext is asequence of words ， 
那么 对 应 的 矩阵 为 : 


a funny 1s mining of sequence text words 


10-3” 词 条 -文档 关系 矩阵 


QD 本 例 来 自 刘 思 赫 的 《R 语言 环境 下 的 文本 挖 气 》。 
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浴 在 语义 分 析 和 主题 模型 


如 前 文 所 说 ,为 了 进行 更 深 层次 的 语义 分 析 ,， 人 研究 学 者 们 不 再 满足 于 简单 的 癌 量 
空间 模型 。 为 了 更 好 地 开展 次 入 的 文本 控 据 或 目 然 语言 任务 ， 研 究 人 员 开 始 奶 求 更 适 
合 挖掘 文 本 次 在 语义 的 文本 表达 方法 。 


传统 语言 模型 


过 去 的 文本 表达 方法 集中 在 空间 癌 量 模型 和 统计 语言 模型 。 两 者 时 然 一 个 基于 
线性 代数 的 几何 变化 ， 为 一 个 基于 统计 概率 分 布 ， 但 虱 将 文档 表示 为 在 词典 空间 上 
的 分 布 。 


可 量 空间 模型 ( 也 称 词组 癌 量 模型 ) 作为 癌 量 的 标识 符 〈 比 如 索引 )， 是 一 个 用 
来 表示 文本 文件 的 代数 模型 。 它 应 用 于 信息 过 泪 、 信 息 检 索 、 索 引 以 及 关联 规则 。 
Salton 、Wong 和 Yang 等 人 提出 的 TF-IDF 模型 ( 词 频 - 逆 癌 文件 频率 )， 是 一 个 我 们 融 
悉 的 传统 问 量 空间 模型 。 癌 量 空间 模型 简单 有 效 ， 第 用 于 文档 表示 ， 被 广泛 运用 在 如 
谷歌 、 百 度 等 搜索 引擎 中 的 检索 模型 里 。 而 统计 声言 模型 不 同 于 空间 回 量 模型 的 线性 
代数 基础 ， 是 基于 统计 学 的 概率 分 布 处 理 文档 。 


统计 语言 模型 是 由 自然 语言 处 理 大 师 贾 里 尼克 首先 提出 的 。 在 此 之 前 ， 由 乔 姆 斯 
基 ( Noam Chomsky， 有 史 以 来 最 伟大 的 语言 学 家 ) 提出 的 “形式 语言 ”使 得 人 们 坚 
定 地 利用 语法 规则 的 办 法 进行 文字 处 理 。 遗 憾 的 是 ， 几 十 年 过 去 了 ， 在 计算 机 处 理 语 
言 领域 ,基于 这 个 语法 规则 的 方法 几乎 毫 无 突破 。 首 先 成 功利 用 数学 方法 解决 自然 语 
言 处 理 问题 的 就 是 贾 里 尼克 。 统 计 语言 模型 主要 是 研究 一 个 文本 序列 的 生成 概率 ， 随 
后 的 多 元 语言 模型 、 混 合 模型 、pLSI 模 型 和 概率 图 模型 都 是 基于 统计 语言 模型 发 展 而 
来 的 。 其 中 ，pLSI 模型 (也 称 pLSA 模型 ) "是 将 用 线性 代数 分 析 潜在 语义 的 方法 转 
成 运用 概率 统计 的 分 析 模式 的 模型 。 

运用 概率 统计 的 方法 来 分 析 潜 在 语义 不 仅 可 以 更 方便 地 引入 更 多 的 信息 ( 如 先 验 
言 息 )， 更 方便 地 对 模型 进行 扩展 ( 如 引入 作者 、 时 间 维 度 )， 还 使 得 更 多 启发 式 处 理 
手段 得 到 理论 上 的 解释 ， 如 概率 分 布 中 的 平滑 估计 。 


Q@ 这 个 模型 有 pLSI 和 pLSA 两 种 叫 法 ， 其 中 pLSI 中 的 I 了 是 Indexing 的 缩写 。 最 早 的 LSI 是 在 检索 背 
景 下 提出 的 ,但 随后 的 pLSI 运 用 已 不 再 局 限于 检索 问题 。 
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主题 模型 


主题 模型 (Topic Model ) 作为 近年 来 最 受 关注 的 统计 语言 模型 之 一 ,进一步 发 展 
了 潜在 语义 模型 , 将 “语义 ”维度 表示 为 “主题 ”的 多 项 式 分 布 。 通 过 引入 主题 空间 ， 
主题 模型 不 仅 考虑 了 传统 回 量 空间 模型 和 语言 模型 中 文档 在 词典 空间 的 维度 , 也 实现 
了 文档 在 主题 空间 上 的 表示 。 

图 10-4 给 出 了 几 个 主题 的 例子 ,不 同 的 主题 对 应 不 同 的 语义 ,由 不 同 的 词 集合 ( 图 
中 的 每 一 个 框 ) 表示 ， 即 每 个 主题 是 一 个 多 项 式 分 布 。 例 如 第 一 个 框 中 , 通过 music、 
jazz、pop 等 词 的 概率 分 布 共 同 表示 出 一 个 与 音乐 有 天 的 主题 。 


music book art ame show 
band life museum nicks fm 
songs novel show nets television 
roc story exhibition points movie 
album books artist team series 
Jazz man artists season SayS 
pop Storles paintings play life 
song love painting games man 
singer children century night character 
nignt family Works coach know 
theater clinton stock restaurant budget 
play. bush market sauce tax 
production campalgn percent menu governor 
Show gore . fund food county 
stage political investors dishes mayor 
street republican funds street billion 
broadway dole . companies dining taxes 
director presidential .stocks dinner plan 
musical senator investment chicken leglslature 
directed house trading served iscal 


10-4 ”主题 模型 结果 展示 


可 以 看 到 在 上 面 的 例子 中 ， 即 使 原文 两 句 话 没 有 出 现 共同 的 单词 ， 也 可 以 判断 在 
同一 个 框 中 的 词 是 相似 的 ， 从 而 判断 句子 的 相似 性 。 这 就 是 主题 模型 相 较 传统 方法 的 
优势 ， 所 以 在 判断 文档 相关 性 的 时 候 需 要 考虑 到 文档 的 语义 。 而 语义 挖掘 的 利 癌 是 主 
题 模型 ， 在 主题 模型 中 ,“ 主 题 ” 表 示 一 个 概念 、 一 个 方面 ， 表 现 为 一 系列 相关 的 单 
词 ， 是 这 些 单词 的 条 件 概率 。 形 象 地 说 ， 主 题 就 是 一 个 桶 ， 里 面 装 了 出 现 概 率 较 高 的 
单词 ， 这 些 单词 与 这 个 主题 有 很 强 的 相关 性 。 这 个 棚 就 像 图 10-4 中 的 框 , 一 个 主题 是 
由 这 个 框 中 的 所 有 单词 及 其 概率 构成 的 。 

靳 志 辉 在 系列 文章 《LDA 数学 八卦 》 中 用 上 帝 掷 仍 子 的 比喻 来 描述 主题 模型 的 生 
成 过 程 。 假 设 上 贡 有 两 大 坛子 的 般 子 ， 第 一 个 坛子 装 的 是 文档 -主题 骸 子 ， 第 二 个 坛 
子 装 的 是 主题 -词语 人 般 子 。 上 帝 随机 地 从 第 二 个 坛子 中 独立 地 抽取 了 天 个 主题 -词语 人 般 
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子 ， 编 号 为 1]~K。 每 次 生成 一 篇 新 的 文档 前 ， 上 帝 先 从 第 一 个 坛子 中 随机 抽取 一 个 文 
档 -- 主 题 骨 子 ， 然 后 重复 如 下 过 程 生成 文档 中 的 词 : (1) 投 撕 这 个 文档 -主题 角子 ,得 
到 一 个 主题 编号 z; (2) 选择 K 个 主题 -词语 山子 中 编号 为 z 的 那个 ， 投 掷 这 个 蜗 子 ， 
于 是 得 到 了 一 个 词 。 这 样 重复 下 去 ， 直 至 产生 一 篇 文档 。 

这 样 看 来 ， 一 篇 文章 的 每 个 词 都 是 通过 “以 一 定 概率 选择 了 某 个 主题 ， 并 从 这 个 
主题 中 以 一 定 概率 选择 某 个 词语 ”这 样 一 个 过 程 得 到 的 。 那 么 ， 如 果 我 们 要 生成 一 篇 
文档 ， 它 里 面 的 每 个 词语 出 现 的 概率 如 网 10-5 所 示 。 


p( 词 语 | 文档 )= > p( 词 语 | 主题 )xp( 主 题 | 文档 ) 
j 题 
10-5 文档 中 词语 出 现 的 概率 
这 个 概率 可 以 用 和 矩阵 表示 ， 如 图 10-6 所 示 。 


文档 主题 


词 词 尘 
x 
语 语 题 


10-6 ”文档 中 词语 出 现 概率 的 窍 阵 表示 


其 中 文档 -词语 矩阵 表示 每 个 文档 中 每 个 单词 的 词 频 ,， 即 出 现 的 概率 ; 主题 -词语 
矩阵 表示 每 个 主题 中 每 个 单词 的 出 现 概率 ; 文档 -主题 矩阵 表示 每 个 文档 中 每 个 主题 
出 现 的 概率 。 给 定 一 系列 文档 ， 通 过 对 文档 进行 分 词 ， 计 算 各 个 文档 中 每 个 单词 的 词 
频 就 可 以 得 到 左边 的 文档 -词语 和 矩阵。 主题 模型 就 是 通过 左边 这 个 矩阵 进行 训练 ， 学 
习 出 右边 两 个 矩阵 。 


如 前 文 所 述 , 浴 在 主题 分 析 已 经 广泛 运用 于 社交 网 络 的 目 然 语言 处 理 中 。 最 为 热 
门 的 应 用 当 属 微 博 关键 词 ， 微 博 关 键 词 致力 于 挫 据 出 用 户 在 微 博 上 关注 的 主题 。 最 初 
的 版 本 只 是 根据 高 频 词 计算 ， 但 随后 便 加 入 了 海 在 语义 分 析 的 技术 。 最 终 的 关键 词 
展示 也 用 到 了 词 云 的 可 视 化 方法 ， 较 大 的 词 代表 较 蜗 的 频 认 (概率 )， 较 小 的 词 代表 
较 低 的 频率 〈 概率 )。 通 过 这 种 日 然 语 言 处 理 方 法 和 可 视 化 展示 ， 很 清楚 地 展现 了 用 
户 在 社交 网 络 上 的 兴趣 爱好 。 图 10-7 中 的 用 户 很 可 能 更 俩 好 文艺 : 图 书 、 摄 影 、 视 
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10-7 ”主题 模型 在 微 博 关键 词 中 的 应 用 〈 另 见 彩 插 ) 


在 《MIT 科技 评论 》 评 选 出 的 2013 十 大 突破 科技 中 ， 深 度 学 习 高 居 榜 首 。 如 采 
说 机 带 学 习 已 经 被 广泛 用 于 月 然 语 言 处 理 之 中 , 那么 次 度 学 习 的 应 用 还 处 于 困难 与 机 
遇 并 存 的 阶段 。 人 简单 来 说 , 机 各 学 习 中 的 人 工 特 征 工程 可 以 被 深度 学 习 模 型 自动 习 得 ， 
并 且 这 些 自 动 学 习 的 特征 不 仪 可 能 本 和 号 就 拥有 非常 好 的 解释 性 ,而且 还 能 使 得 后 续 训 
练 出 的 分 类 絮 有 更 好 的 表现 。 现 阶段 ， 深 度 学 习 在 目 然 语言 处 理 任务 中 最 大 的 突破 就 
是 语音 处 理 ， 上 文 提 到 的 苹果 Siri、 微 软 Cortana、Google Now、Skype 实时 对 话 翻 译 


以 及 百度 、 搜 狗 、 讯 飞 的 语 首 助手 等 都 用 到 了 深度 学 习 。 


深度 学 习 将 以 前 目 然 语言 处 理 中 的 字面 匹配 〈 词 典 、One-hot Representation ) 转 
变 成 了 基于 上 下 文 的 语义 匹配 ( Distributed Representation )。 回 顾 上 文 One-hot 


Representation 的 例子 : 


狂 ” 表 不 为 [1, 0, 0,.…, 0, 0, 0] 
“ 狗 ” 表 示 为 [0, 1, 0,.…, 0, 0, 0] 
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虽然 简洁 , 但 存在 的 一 个 重要 的 问题 就 是 词汇 鸿沟 现象 : 任意 两 个 词 之 间 都 是 孤 
立 的 ， 即 Similarity( 猫 ， 狗 ) = 0。 任 何 两 个 词 ， 哪 怕 是 近义词 ， 也 不 可 渴 免 。 深度 学 
习 带 来 的 Distributed Representation (单词 的 分 布 向 量 表 示 ”) 却 可 以 在 一 定 程度 上 解 
决 这 个 问题 。 在 单词 的 分 布 癌 量 表示 下 ， 


“ 狂 ” 可 表示 为 [1, 0, 0.6, 0, 0] 
“ 狗 ” 可 表示 为 [1, 0, 0.5, 0.3, 0] 


此 时 ， 至 少 Similarity( 猫 ， 狗 ) > 0， 且 可 以 想象 ， 会 大 于 Similarity( 猫 ， 我 )。 这 
是 因为 ,单词 的 分 布 向 量 表示 本 质 上 是 应 用 上 下 文中 的 语义 特征 进行 的 。 深 度 学 习 的 
单词 分 布 回 量 表示 使 得 意义 相似 的 词 拥 有 相似 的 回 量 ， 也 就 可 以 将 相似 的 句子 找 出 。 
如 果 将 一 个 句子 中 的 某 个 词 换 成 它 的 同义词 (如 将 the cat is white 替换 成 the cat is 
black )， 虽 然 从 字面 上 看 ， 句 子 变化 很 大 ， 但 次 度 学 习 却 可 以 将 这 样 的 变化 在 模型 训 
练 中 映射 到 相近 的 空间 ， 使 训练 数据 量 大 大 减少 。 

也 就 是 说 ,在 单词 层面 引入 这 种 分 布 问 量 表示 后 , 在 更 高 更 大 的 粒度 上 也 有 了 类 
似 的 表示 方法 ， 这 些 都 是 可 以 使 用 模型 推导 的 。 就 像 Luong 等 人 (2013 )“ 在 论文 中 
写 到 的 ， 这 样 的 单词 表示 方法 是 极其 有 用 的 : 

利用 单词 特征 表示 …… 已 经 成 为 近年 来 许多 NLP 系统 成 功 的 秘密 起 器， 
包括 命名 实体 识别 、 词 性 标注 、 语 法 分 析 和 语义 角色 标注 。 


除了 上 述 在 一 个 数据 集 上 学 习 某 个 特征 然后 应 用 到 不 同 任务 上 , 我 们 还 可 以 从 多 
种 数据 集中 学 习 出 同一 种 单一 特征 ， 如 Socher 等 人 (2013 ) 提出 的 双语 单词 能 入 ， 即 
同时 运用 汉语 和 瑞 才 作 为 训练 博 料 ， 最 后 基于 一 定 的 假设 猜想 ， 两 种 声言 就 能 够 “ 重 
合 "。 让 我 们 来 看 一 下 他 们 的 结 霖 ， 如 图 10-8 所 示 。 


Q) Distributed Representation ， 还 未 有 严格 的 公认 的 中 文 翻 译 ， 本 书 暂 时 翻译 为 直观 理解 的 “单词 的 分 
布 问 量 表示 ”。 

@) 如 果 读 者 对 Distributed Representation 为 什么 如 此 神奇 感 兴趣 ， 可 以 阅读 “A Neural Probabilistic 
Language Model” 这 篇 蜡 祖 级 论文 : Bengio, Yoshua, et al. Neural probabilistic language models. 


Innovations mn Machine Learning. Springer Berlin Heidelberg, 2006. 137-186. 
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10-8 ”Socher 等 人 提出 的 双语 单词 能 入 的 实验 结果 


总 的 来 看 ， 深度 学 习 与 传统 方法 比较 起 来 ， 可 以 抛 折 特征 选择 步 又 ， 而 这 正和 是 过 
去 机 融 学 习 中 最 耗费 人 工 成 本 的 步 怠 。 融 入 语义 级 特征 的 优点 已 经 不 言 而 喻 。 不 仅 如 
此 ,深度 学 习 的 许多 模型 可 以 使 很 多 应 用 可 以 直接 绕 过 日 然 语 言 处 理 的 中 间 场 景 ， 比 
如 POS、 句 法 分 析 ,， 这 样 可 以 大 大 减少 任务 的 错误 累加 。 邦 外， 又 由 于 很 多 还 未 能 完 
全 证 明 的 优化 技巧 〈 很 可 能 很 快 就 会 被 证 明 )， 深 度 学 习 的 模型 也 受到 了 业界 工程 师 
的 青睐 。 


困难 与 展望 


尽管 本 章 仅 仅 提 到 了 搜索 引擎 、 社 交 网 络 和 移动 应 用 中 的 一 些 目 然 语言 处 理 的 应 
用 ， 但 相信 读者 很 容易 联想 到 机 器 翻译 、 语 音 识 别 、 问 答 系 统 等 都 是 自然 语言 处 理 活 
透 到 生活 中 的 例子 。 广 义 的 目 然 语言 处 理 便 可 以 通过 日 然 语言 的 应 用 来 前 释 : 语音 识 
别 、 机 名 翻译 、 信 息 检索 、 目 动 问答 、 文 本 摘要 、 人 情感 分 析 、 导 情 分 析 等 。 上 自然 语言 
处 理 的 应 用 核心 技术 又 可 以 反映 在 以 下 层级 中 。 

口 目 然 请 言 处 理 的 各 个 任务 中 , 首先 需要 有 数据 收集 。 稼 见 的 有 三 种 类 型 的 数据 : 

词典 , 分 词 和 词法 分 析 内 可 用 到 ; 知识 库 ， 多 用 于 高 级 语义 分 析 ; 语 料 ， 用 于 
统计 词汇 共 现 等 数据 。 本 章 第 二 节 已 提 到 大 数据 收集 的 必要 性 。 
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D 随后 ， 第 二 层 是 词 条 级 ， 这 是 语义 理解 的 基础 层面 。 其 中 ,词法 分 析 包 含 分 词 
分 词 、 词 性 标注 和 未 登录 词 识 别 ; 词 条 语义 的 表示 ; 词 条 关系 表示 和 知识 库 构 
建 。 在 词 条 基础 上 进行 的 浅 层 词法 分 析 、 句 法 分 析 和 信息 检索 中 的 查询 扩展 蔡 
换 仍 在 各 类 应 用 中 占据 重要 地 位 。 比 如 , 近年 来 ， 基 于 用 户 意图 分 析 的 查询 研 

口 在 词语 语义 计算 的 基础 上 , 第 三 层 就 是 篇 莉 级 的 语义 理解 , 分 为 单 文档 分 析 和 
多 文档 分 析 ，pLSA 和 主题 模型 都 属于 此 范畴 。 


可 以 看 到 ,粒度 或 层级 是 自然 语言 处 理 的 又 一 个 核心 问题 。 不 同 的 研究 方法 在 不 
同 粒 度 上 运行 的 效 采 是 不 一 样 的 。 这 一 点 寓 来 的 问题 在 社交 网 络 的 文本 处 理 中 尤为 突 
出 。 社 交 网 络 的 典型 代表 微 博 (microblog ) 平台 中 ( 如 推 符 和 微 博 ) 的 短文 本 问题 市 
来 的 挑战 是 巨大 的 。140 字 的 文本 长 度 使 得 收 义 性 更 为 普遍 。 为 了 消除 上 收 义 性 和 进 一 
步 挖掘 潜在 语义 ， 人 们 开始 尝试 添加 更 多 的 外 部 信和 是 和 外 部 知识 的 手段 。 外 部 知识 和 
外 部 信息 可 以 大 致 分 为 社交 网 络 无 关 和 社交 网 络 相关 两 类 : 前 者 是 通用 的 语义 语法 的 
结构 化 定义 的 添加 ， 代 表 工 作 有 Mimno、 Zhiyuan Chen 和 Jerry Zhu; 后 者 是 将 社交 
网 络 相 关 的 用 户 行为 和 用 户 信息 加 入 人 研究 模型 。 在 这 里 , 复 森 网 络 人 研究 和 社会 学 理论 
都 有 了 不 蚀 的 进展 ， 代 表 工 作 有 MinghuiQiu 融合 了 用 户 行为 分 布 的 behavior-topic 
model 和 Yan Liu 融合 作者 信息 和 学 术 社 区 的 Topic-link LDA。 


大 规模 语 料 市 来 的 机 遇 与 挑战 


虽然 海量 实时 数据 和 计算 能 力 的 提高 为 日 然 二 言 处 理 市 来 了 春天 , 但 也 市 来 了 新 
的 挑战 。 比 如 ， 当 统计 语言 模型 的 效果 严重 依赖 于 语 料 的 数量 时 ,往往 训练 语 料 越 多 
越 能 更 好 地 提升 模型 的 训练 结果 , 但 训练 语 料 的 增加 对 于 计算 能 力 的 要 求 是 指数 级 增 
长 的 。 举 例 来 说 ， 为 了 达到 一 流 ( state-of-art ) 的 水 平 ， 近 几 年 的 学 术 界 翻译 模型 和 
句法 分 析 模 型 的 训练 时 间 需 要 一 到 两 个 月 。 但 在 工业 界 ， 这样 的 训练 时 间 往 往 是 不 可 
接受 的 。 

一 方面 ， 大 规模 的 语 料 收 集 工作 在 可 见 的 未 来 将 依然 继续 进行 。 比 如 在 开放 域 信 
县 抽取 问题 上 ， 卡 耐 基 梅 隆 大 学 的 Readthe Web 研究 加 是 一 个 号 称 “了 永 不 俘 止 的 语言 
学 习 (Never-Ending Language Learning，NELL ”项 目 。 而 在 知识 图 谱 的 构建 问题 上 ， 
目前 的 互联 网 知识 资源 仍然 难以 满足 中 文理 解 的 需求 。 以 谷歌 知识 图 谱 (5 亿 个 实体 ， 
35 亿 个 事实 ) 为 例 : 主要 描述 实体 以 及 实体 之 间 关 系 ， 对 于 复杂 事件 的 描述 甚 少 ; 英 
文 知识 图 谱 关 于 中 国 的 内 容 很 少 ; 中 文 知识 图 谱 正 在 构建 中 ， 一 个 主要 的 挑战 是 
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infobox 信息 匮乏 ， 百 度 知识 图 谱 与 搜狗 知 立 方 也 面临 类 似 的 问题 。™ 


a 过 去 分 布 式 相关 的 大 数据 处 理 技术 会 继续 发 展 , 但 依旧 有 新 的 工 
作 通 过 语言 模型 的 简化 来 降低 对 于 计算 能 力 的 要 求 ， 比 如 深度 学 习 一 市 中 提 到 的 
Distributed Representation 词 回 量 表 示 方 法 ， 它 用 简单 的 模型 达到 了 意 想 不 到 的 极 好 的 
效果 ， 从 而 极 大 地 提高 了 计算 速度 。 


不 难 推测 ， 在 大 数据 时 代 ， 将 会 出 现 新 的 语言 模型 甚至 是 理论 框架 。 深 度 学 习 通 

学 习 模 型 的 “深层 结构 ”从 而 对 数据 中 存在 的 复 林 关系 进行 建 模 ， 虽 不 能 显 车 降低 

> 但 在 小 规模 有 标注 样本 和 极 大 规模 无 标注 样本 的 融合 学 习 中 ， 可 能 会 给 语 

义 分 析 带 来 突破 性 的 成 果 。 尽 管 深 度 学 习 已 经 取得 了 相关 进展 , 但 是 人 们 依然 希望 通 
习 来 理解 人 类 语言 产生 的 过 程 一 一 人 类 在 阅读 文字 或 者 加 工 文字 时 ,究竟 经 

了 怎样 的 步骤 ?” 是 层级 递 进 ( 见 图 10-9 ) 还 是 模式 匹配 ? 是 自 上 而 下 还 是 目下 而 
A ene ee 


图 10-9 自然 语言 处 理 是 否 像 一 座 大 楼 一 样 ， 层 层 递 进 ? 


Q 详情 可 参考 :; Google's Knowledge Graph: one step closer to the semantic web?(http://econsultancy. 
com/cn/blog/62241-google-s-knowledge-graph-one-step-closer-to-the-semantic-web)。 


第 10 章 ， 无 处 不 在 的 自然 语言 处 理 | 239 


参考 文献 


[1 Andrzejewski D, Zhu X, Craven M, et al. 2011. A framework for ncorporating general domain 
knowledge into latent Dirichlet allocation using first-order logic. JJCAL 1171-1177. 

[2] Bengio, Yoshua, et al. Neural probabilistic language models. Innovations ln Machine Learning. 
Springer Berlin Heidelberg, 2006. 137-186. 

[3] Bishop CM, Pattern Recognition and Machine Learning (Information Sclence and Statistics). 
Springer-Verlag New York, Inc., Secaucus, NJ, USA, 2000. 

[4] AlSumait L, Barbar& D, Domeniconi1 C. On-line lda: Adaptive topic models for mining text 
streams with applications to topic detection and tracking. In Proceedings of the 2008 Fighth IEEE 
International Conference on Data Mining, pages 3—12,Washington, DC, USA, 2008. IEEE 
Computer Society. 

[$] Blei D M. lda-c, 2003. 

[6] Blei1 D M, Ng A Y, Jordan M I. Latent dirichlet allocation. J. Mach. Learn. Res.,3:993—1022, 
March 2003. 

[7] Chen Z, Mukherjee A, Liu B, et al. Discovering Coherent Topics using General Knowledge. 
Proceedings of the ACM Conference of Information and Knowledge Management (CIKM'13). 
October 27 - Novemberl, Burlingame, CA, USA. 

[8] Liu YY, Mizil AN, Gryc W. Topic-link LDA: jomnt models of topic and author community. ICML., 
volume 382 of ACM International Conference Proceeding Series, page 84. ACM, (2009) 

[9] Mikolov T, Chen K,Corrado G, etal.2013a. Efficientestimation of word representations In Vector 
space.arX1v preprint arXiv:1301.3781. 

[10] Mikolov T, Sutskever I, Chen K, et al. 2013b. Distributed representations of phrases and their 
compositionality. In NIPS. 

[11] Mikolov T, Yih S W, Zweig G. 2013¢c. Linguistic regularities in continuous Space word represent- 
tations. In NAACL HLT. 

[12] Mimno D, Wallach H, Talley E, et al. Optimizing Semantic Coherence In Topic Models.EMNLP 
(2011). 

[13] Hofmann T. Unsupervised learning by probabilistic latent semantic analysis. Mach. Learn., 
42:177-—196, January 2001. 

[14] Plaut, David C, et al. Understanding normal and 1mpaired word reading: computational principles 
In quasi-regular domains. Psychological review 103.1 (1996): $6. 

[15| Qiu M, Zhu F, Jiang J. It ls not just what we say, but how we say them: LDA-based behavior-topic 
model. In Proceedings of the SIAM International Conference on Data Mining (SDM'13), pages 
794-802, 2013. 

[16] Zou Will Y, etal. Bllingual Word Embeddings for Phrase-Based Machine Translation. EMNLP, 2013. 

[17] 孙 戊 松 . 大 数据 时 代 的 目 然 语言 处 理 : 前 沿 与 进展 .第 十 四 届 中 国 少数 民族 语言 文字 信息 处 
理学 术 人 研讨 会 . 兰州 ，2013. 


240 ， 科 学 的 极致 : 漫谈 人 工 智能 


[18] 吴军 . 数学 之 美 . 北京 : 人 民 邮 电 出 版 社 , 2012. 
[19] licstar. Deep Learning in NLP 〈 一 ) 词 回 量 和 语言 模型 . http://licstar.net/archives/328. 
[20] 靳 志 辉 . LDA 数学 八卦 . http://cos.name/2013/03/lda-math-lda-text-modeling/. 


作者 简介 


李 十 然 ， 北京 大 学 智能 与 科学 技术 系 本 科 生 ， 现 香港 理工 大 学 研究 助理 。 主 要 钻研 社交 网 
络 中 的 文本 挖掘 和 中 文 表示 学 习 ， 同 时 对 于 理论 机 器 学 习 和 应 用 机 器 学 习 有 着 广泛 的 兴趣 。 曾 
在 自然 语言 处 理 相关 的 顶 会 上 发 表 过 论文 ， 在 集 智 俱 乐 部 举办 过 两 次 关于 自然 语言 处 理 的 读书 
会 活动 ， 观 看 活动 视频 可 扫 下 方 二 维 码 。 


罕 11 瘟 ”从 向 单程 序 到 群集 智能 


张江 


20 世纪 80 年 代 ， 以 美国 圣 境 菲 研究 所 为 代表 的 一 小 报 科 学 家 开始 尝试 一 种 全 新 
的 途径 来 探索 人 工 智能 。 他 们 并 没有 将 目光 投 回 实用 而 复杂 的 智能 算法 ， 甚 至 并 不 奢 
望 模拟 人 类 高 超 的 智 意 。 他 们 探索 的 动力 仅仅 来 源 于 对 异 稼 简单 的 计算 机 代码 的 好 奇 
心 ， 他 们 和 希望 从 这 些 代 码 中 观察 到 意 想 不 到 的 涌现 模式 (emergent pattern )。 


在 惊叹 于 一 个 个 活灵活现 的 简单 程序 之 后 ,他 们 竖 起 了 复杂 性 科学 的 大 旗 ， 坚 定 
地 摊 毁 了 不 同学 科 的 隔 同 ， 走 上 了 探索 一 般 复杂 系统 普 适 理论 的 道路 。 尽 管 这 条 过 路 
比 他 们 早期 预料 的 要 师 凤 得 多 , 但 他 们 始终 没有 放弃 。 在 一 系列 影响 广泛 的 复杂 性 人 研 
究 工具 ( 包括 多 主体 、 复 杂 网 络 、 人 类 行为 动力 和 学、 经济 物 理 等 ) 被 提出 之 后 ， 和 群集 
智能 作为 集体 行为 研究 的 一 个 副产品 也 被 提出 来 了 了 ， 并 最 终 成 为 实现 智能 的 为 类 途 
径 。 而 所 有 这 一 切 各 来 源 于 卉 常 徊 单 的 计算 机 程序 。 下 面 ， 避 ® 让 我 们 走 进 何 单程 序 的 
世界 。 


迭代 方程 与 生物 形态 
让 我 们 从 下 面 这 个 简单 的 迭代 方程 开始 我 们 的 探索 之 旅 。 


1 
WS 3 Rs 


y 3xy—y 
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这 里 ，(x,y) 是 一 个 二 维 坐 标 ， 该 坐标 按照 上 述 方程 进行 反复 的 迭代 。 例 如 ， 我 们 
将 x=0,y=0 代 入 方程 的 右 侧 ， 计 算出 /2 和 0 作为 新 的 二 维 坐标 x= 1/2, y=0， 然 
后 我 们 再 将 它 代 入 方程 右 侧 ， 计 算得 到 x=5/8，y=0， 再 将 它 代 入 方程 的 右 侧 …… 过 
代 使 得 这 些 坐 标点 划 过 一 条 奇怪 的 轨迹 。 


如 采 我 们 将 迭代 初始 点 记 为 (xo,yo), 100 步 (足够 长 时 间 ) 后 的 坐标 记 为 (cioo, ioo)， 
那么 ， 变换 初始 点 (xo,y0o) 目 然 会 得 到 不 同 的 终止 点 (xio0,y100)。 我 们 不 妨 近 历 屏 硕 上 的 
所 有 点 ， 让 它们 作为 (xo， Jo0)， 并 根据 (xioo, yi100) 的 位 置 来 对 (xo， J0) 进 行 分 类 : 如 果 (xioo， 
yi00) 沙 入 了 图 11-1 所 示 的 阴影 区 域 ， 就 把 屏幕 上 的 原始 点 (xzo,yo) 标 成 黑色 ,否则 就 标 
成 


11-1 和 友 代 程序 说 明 图 〈 其 中 /为 一 个 足够 大 的 常数 ， 例 如 1000) 


那么 ， 这 些 黑 晶 点 最 终 会 形成 什么 样 的 网 形 呢 ? 答案 竟然 是 一 只 放射 虫 ! 如 图 
11-2 所 示 。 
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11-2 ”模拟 放射 虫 


这 个 家 伙 不 仪 张 牙 舞 爪 的 很 是 钨 饰 , 而 且 在 它 的 中 心 似乎 还 有 一 些 种 子 即 将 破 腹 
而 出 ! 不仅 如 此 , 如 来 我 们 变换 过 代 方程 , 还 会 得 到 各 式 各 样 的 微生物 形态 , 如 图 11-3 
所 未 。 


SIN[Z}+€4 C 


图 11-3 ”各 种 模拟 的 生物 形态 〈 图 片 来 自 卡 斯 蒂 《 虚 实 世 珊 》 ) 
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图 11-3 各 个 方程 中 的 Z 是 一 个 复数 ， 它 可 以 写成 : Z=x+yi 的 形式 ， 其 中 i 是 虚 
数 单 位 。 它 同样 可 以 写成 关于 x 和 vy 的 迭代 方程 。C 是 一 个 复数 常数 。 

令 人 吃惊 的 是 , 这 种 看 似 极 其 简单 的 迭代 方程 之 中 竞 然 缠 含 了 复杂 而 允 真 的 原生 
生物 形态 ， 这 不 禁 让 我 们 感叹 : 也 许 上 帝 真 的 是 按照 和 测 单 的 数学 方程 来 创造 宇宙 的 ， 
甚至 包括 异常 复杂 的 生物 形态 ! 


生命 洲 戏 


虽然 这 些 人 简单 的 迭代 方程 能 创造 各 式 的 生物 形态 , 但 是 它们 孝 仅 仅 是 一 张 静 止 的 
图 片 而 已 。 下 面 ， 我 们 再 来 认识 一 个 可 以 动 起 来 的 简单 程序 ， 它 的 名 字 叫 作 “ 生 命 游 
戏 ”( Game of Life )。 

考虑 一 个 由 方 格 构成 的 世界 。 在 这 个 世界 中 ,生活 着 一 群 外 星 生 物 ， 如 果 某 一 个 
方 格 被 一 个 生物 体 占 领 ， 那 么 该 方 格 就 涂 黑 ， 否 则 方 格 为 空白 ， 如 图 11-4 所 示 。 


图 11-4 生命 游戏 的 方 格 世 磺 
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诞生 规则 死亡 规则 
11-5 生命 游戏 中 的 生死 规则 《灰色 区 域 为 中 间 方 格 的 邻 域 ) 


口 如 果菜 一 个 方 格 没有 生物 体 , 并 且 它 周围 的 8 个 邻居 方 格 中 刚好 有 3 个 生物 体 
(黑色 方 格 ) 则 在 当前 方 格 诞生 一 个 生物 体 ( 将 方 格 涂 黑 ) 一 一 外 星 生 物 居 然 
是 三 性 繁殖 1 

口 如 有 果 某 一 个 方 格 已 经 有 一 个 生物 体 , 而 它 周 围 的 8 个 邻居 方 格 中 有 少 于 2 个 生 
物体 ( 黑色 方 格 )， 则 它 就 会 由 于 过 分 孤独 而 死亡 ;反之 如 果 8 个 邻居 中 有 超 
过 或 者 等 于 4 个 生物 体 , 则 它 就 会 由 于 过 分 拥挤 而 死亡 ， 即 将 该 方 格 由 黑色 变 
成 白色 。 

束 这 样 ， 在 每 个 时 刻 , 方 格 世 界 中 的 每 一 个 方 格 都 会 根据 日 己 周围 8 个 邻居 的 状 

态 而 变换 看 日 己 的 颜色 ， 从 而 形成 了 意 想不到 的 动态 。 
站 和 完 , 我 们 会 观察 到 , 这 些 方 格 构成 的 模式 既 非 随机 又 非 秩序 , 它们 游荡 于 混沌 与 


秩序 的 边缘 。 不 经 意 间 ,会 诞 后 一些 看 似 非常 对 称 的 图 形 ， 例如 只 美丽 的 贿赂 或 是 
一 颗 心 ( 见 图 11-6 )， 但 很 快 地 ， 对 称 性 就 会 被 它们 周 于 一 些 零 散 的 黑色 方 格 所 打破 。 
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图 11-6_ 生命 游戏 演化 出 来 的 一 些 “ 沸 腾 ” 的 结构 


246 ， 科 学 的 极致 : 漫谈 人 工 智能 


在 满 屏 沸腾 的 花纹 中 ,我 们 还 会 发 现 一 个 神奇 的 家 伙 ， 它 被 人 们 称 为 “滑翔 机 ”。 
这 个 可 爱 的 小 家 伙 一 旦 诞生 ， 就 会 缓慢 地 移动 着 身体 ， 从 屏幕 的 一 端 大 摇 大 摆 地 移动 
到 屏幕 的 另 一 端 ( 见 图 11-7 )。 你 可 别 小 看 了 这 个 小 家 伙 ， 它 在 “生命 游戏 ”的 世界 
中 起 到 了 重要 的 信息 沟通 的 作用 。 甚 至 可 以 从 数学 上 证 明 ， 利 用 这 些 “ 滑 翔 机 ”， 我 
们 完全 可 以 在 “生命 游戏 ”虚拟 世界 中 构造 一 台 通 用 计算 机 。 也 就 是 说 ,任意 一 种 计 
算 机 能 够 完成 的 计算 功能 都 可 以 在 这 个 “生命 游戏 ”世界 中 利用 小 小 的 “滑翔 机 ”组 
合 实现 ( 见 图 11-8、 图 11-9 )。 


3 EE 


11-7 “滑翔 机 "一 步 移动 的 动态 演化 
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11-8 ”生命 游戏 中 内 内 的 图 灵机 一 一 图 灵机 就 相当 于 一 台 小 型 计算 机 图片 来 自 Life 32 程序 ) 


在 目 眶 了 这 些 怀 人 而 复杂 的 动态 之 后 ， 生 命 游 戏 的 发 明 者 约翰 ， 康 威 〈John 
Conway ) 甚至 说 出 了 下 面 的 肾 言 壮 语 :“ 只 要 给 我 足够 大 的 模拟 空间 ， 等 待 足 够 长 的 
时 间 ， 生 命 游戏 中 可 能 演化 出 任意 你 能 想到 的 复杂 事物 ， 包 括 可 以 目 我 法 殖 的 细胞 ， 
以 及 能 够 撰写 Ph.D 论文 的 智慧 生命 玉 
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11-9 11-8 中 和 矩形 框 区 域 的 放大 ， 它 们 由 很 多 “滑翔 机 ”构成 图片 来 自 Life 32 程序 ) 


人 工 生 命 


1970 年 10 月， 著名 的 《科学 美国 人 》 杂 志 发 表 了 康 威 的 一 篇 介绍 “生命 游戏 ” 
的 文章 。 很 快 ， 读 到 该 文 的 大 学 生 和 电脑 爱好 者 们 开始 争先 入 ， 后 地 在 自己 的 电脑 上 运 
行 这 款 不 需要 人 参与 的 游戏 ， 并 期 待 着 在 自己 的 电脑 屏幕 上 会 出 现 意 想不到 的 东西 。 


在 这 和 群 人 中 ， 有 一 个 个 子 高 高 却 不 谷 言 突 的 小 伙 子 ， 他 的 名 字 叫 做 克里斯托弗 兰 
顿 〈Christopher Langton )。 那 时 ， 兰 顿 还 是 一 名 室 不 起 眼 的 程序 员 ， 供 职 于 一 家 软件 
公司 。 他 是 一 个 典型 的 夜 猫 子 ， 喜 欢 在 夜深人静 的 时 候 偷偷 溜 进 公司 写 程序 ， 同 时 会 
在 为 一 台电 脑 上 运行 “生命 游戏 ”。 就 这 样 ， 程 序 写 累 了， 他 就 会 转 过 头 来 看 看 “后 
命 游 戏 ” 那 兹 腾 的 屏 硕 ， 以 放松 号 心 。 兰 顿 的 日 子 就 这 样 伴随 着 代码 和 “生命 游戏 ” 
一 大 大 地 对 起 于 

这 一 天 , 他 像 往 常 一 样 边 运 行 “生命 游戏 ” 边 写 程序 。 深夜 的 攻 静 衬托 出 稍 显 啊 腕 
的 机 刊 的 笑 吗 ,仿佛 它们 在 呼吸 。 突 然 ， 兰 顿 感觉 对 后 一 沪 , 似乎 哪里 有 些 不 对 劲 一 一 
仿佛 他 的 号 后 有 双眼 睛 正在 有 四 着 他 。 然 而 ， 当 他 回 过 头 来 部 什么 都 没有 发 现 。 是 哪里 
不 对 人 荔 呢 ? 


这 时 ,他 一 眼 疯 到 了 里 后 电脑 屏 欠 上 运行 着 的 “生命 游戏 ”"。 那 些 “ 滑 翔 机 ”还 
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在 孜孜 不 倦 地 在 屏幕 上 穿 来 穿 去 ， 仿 佛 有 着 上 自己 的 生命 。 奇 怪 的 感 党 居然 来 目 于 它 。 


突然 , 一 道内 电 在 兰 顿 的 脑海 中 划 过 : 对 啊 , 那些 运行 着 的 程序 有 着 自己 的 生命 ， 
它 是 活 的 ! 尽管 “生命 游戏 ”仅仅 是 一 段 代 码 ， 它 没有 和 我 们 一 样 的 血肉 之 驱 ， 但 是 
这 并 不 妨碍 成 二 上 万 的 “滑翔 机 ”在 那里 相互 作用 而 诞生 异常 复 淋 的 模式 与 动态 。 而 
生命 一 一 如 我 们 所 认识 到 的 那些 生命 ( Life as we know ) 不 也 正 是 这 样 一 些 复 洒 
的 模式 与 动态 吗 ? 只 不 过 ， 我 们 所 认识 的 生命 动态 是 由 DNA、 和 蛋 白质 大 分 子 相 互 作 
用 完成 的 ， 而 非 01 代码 。 但 是 ， 我 们 有 何 理 由 相信 分 子 比 代码 具有 更 加 独特 的 优势 
呢 ? 也 许 , 生命 并 不 像 我 们 那样 挑 吻 构成 它 抠 党 的 零件 , 毕 苋 , 驱 完 仅 仅 是 个 内 皮 吉 。 
生命 ， 只 有 它 自己 才 理 解 什么 才 是 真正 的 生命 ( Life as it could be )。 

从 此 , 兰 顿 路上 了 思考 之 路 。1989 年 , 他 在 圣 塔 菲 研究 所 吾 开 了 第 一 届 人 工 生命 
国际 会 议 ， 并 创立 了 “人 工 生 命 ” 这 门 新 学 科 。 

与 人 工 智 能 类 似 ， 人 工 生命 也 主张 运用 计算 机 软件 来 实现 生命 的 功能 。 但 是 ， 人 
工 生 命 更 强调 所 谓 涌 现 的 作用 ， 即 通过 计算 机 中 简单 的 规则 ， 自 下 而 上 地 涌现 出 我 们 
期 待 的 类 似 生命 的 复杂 现象 和 行为 。 


Boid 模 型 


“生命 游戏 ”虽然 表现 不 凡 ， 但 是 它 的 相互 作用 形式 过 于 抽象 ， 也 与 我 们 日 党 观 
察 到 的 生命 现象 相去 其 还。 而 另外 一 个 例子 Boid 模型 ， 则 平易 近 人 了 许多 。Boid 利 
用 三 条 非常 简单 的 规则 ， 通 中 地 模拟 出 了 真实 乌 类 群体 的 飞行 行为 。 


我 们 用 屏幕 上 的 一 个 动 点 来 表示 一 只 飞行 的 岛 。 开 发 者 克 雷 格 ' 雷诺 北 将 这 些 动 
点 称 为 Boid (也 许 这 个 单词 长 得 很 像 Bird )。 如 图 11-10 所 示 ， 每 只 Boid 都 有 一 个 观 
察 视 野 范 围 ， 并 且 会 被 这 个 视野 范围 中 的 其 他 Boid 所 影响 。 
口 靠近 : 每 只 Boid 会 尽量 靠近 视野 范围 内 其 他 Boid 的 中 心 位 置 ; 
口 对 齐 : 每 只 Boid 会 尽量 与 视野 内 其 他 Boid 的 飞行 方 回 保持 一 致 ; 
口 避免 磁 撞 : 如 果 当 前 的 Boid 与 某 只 Boid 或 者 障碍 物 靠 得 太 近 了 ， 则 会 尽量 远 
离 它 。 
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靠近 规则 : 移 向 邻居 的 平均 位 置 
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对 齐 规则 : 将 飞行 方向 调整 为 和 邻居 一 致 分 离 : 避免 与 其 他 乌 碰 撞 
11-10 ”Boid 的 相互 作用 规则 ” 


在 这 三 条 简单 的 规则 下 ， 屏幕 上 的 Boid 群体 会 展现 出 类 似 于 真实 乌 群 的 飞行 轨 
迹 。 它 们 时 而 相互 靠近 ， 彼 此 一 致 地 改行; 时 而 为 了 避免 碰撞 而 相互 分 散 。 当 遇 到 障 
碍 物 的 时 候 ， 还 会 聪明 地 分 成 两 队 ， 从 劳 边 穿 行 而 过 。 所 有 这 些 行为 都 没有 受到 任意 
一 个 Boid 的 指挥 ， 而 是 通过 每 只 Boid 与 周围 群体 的 相互 作用 而 自发 产生 的 。 

更 有 趣 的 是 ， 尽 管 在 整个 Boid 的 模拟 程序 中 ， 没 有 一 个 地 方 包含 着 随机 因素 ， 
但 是 整个 Boid 群体 的 行为 看 起 来 却 非 常 地 复杂 ， 甚 至 连 程序 的 创造 者 也 不 可 能 预测 
出 下 一 时 刻 某 一 只 Boid 究竟 会 飞 到 哪里 。 


Tierra 与 程序 的 进化 


进化 是 我 们 所 观察 到 的 现实 生物 体 的 一 个 最 显著 的 特征 , 那么 寄生 在 电脑 空间 中 
的 生物 体 是 否 也 能 进化 呢 ? 答案 是 肯定 的 。 


GD 图 片 来 源 : http:/wwwred3d.comy/cwrboids/。 
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汤姆 斯 雷 ( Thomas Ray ) 是 美国 俄 克 拉 伍 马 大 学 的 动物 学 家 ,然而 ,他 的 兴 
扩 显 然 不 在 真实 生物 上 ,他 更 加 着 迷 于 计算 机 中 的 虚拟 生命 。 他 在 思考 如 何 创 建 一 个 
卉 与 地 球 生物 圈 相 比拟 的 虚拟 进化 环境 。 


雷 敏 锐 地 觉察 到 ， 现 实生 物 的 优胜 劣 汰 无 非 是 在 竞争 两 种 资源 空间 与 时 间 。 而 
计算 机 天 然 地 有 具备 这 两 样 东西 ， 内 存 空间 和 CPU 时 间 。 


于 是 , 雷 在 内 存 中 专门 开辟 了 一 片 空间 作为 虚拟 的 竞技 场 。 而 虚拟 生命 体 就 是 由 一 
段 一 段 的 汇编 指令 构成 的 程序 段 。 由 汇编 指令 构造 的 生命 体 躺 在 内 存 中 , 等 待 着 执行 指 
针 的 激活 。 人 被 激活 的 指令 会 外 CPU 执行 ， 可 能 进行 茶 种 运算 ， 也 可 能 在 内 存 空间 中 与 
下 一 些 数据 。 这 些 数据 也 是 由 指令 构成 的 程序 ， 也 有 可 能 被 激活 。 于 是 ,那些 反复 被 执 
行 的 程序 段 就 有 了 更 大 的 活力 , 相当 于 具备 了 更 大 的 能 量 。 有 些 程序 段 还 能 够 指挥 命令 

旨 针 让 目 己 在 内 存 空 间 中 完成 目 我 复制 ， 于 是 它们 很 快 就 占领 了 黎 缺 的 内 存 空间 。 


然而 ,仅仅 具备 这 些 还 不 能 创造 出 进化 。 雷 还 发 明了 一 些小 把 戏 来 模拟 残酷 的 环 
境 和 上 和 融 的 恩赐 一 一 变异 。 每 隔 一 段 时 间 ， 一 个 名 为 “收割 机 ”的 程序 就 会 运行 ， 它 
会 随机 地 杀 死 (删除 ) 一 些 程序 。 夯 外 ,在 所 有 这 些 指令 执行 的 过 程 中 ， 系 统 还 会 以 
一 定 的 小 概率 “犯错 误 ”， 这 就 为 生物 体 的 变异 创造 了 可 能 。 于 是 ， 进 化 由 此 发 生 。 
雷 将 他 的 程序 命名 为 “Tierra”， 这 是 一 个 西班牙 语 单词 ， 意 思 是 “地 球 ”。 因 为 雷 相 
信 ，Tierra 会 像 地 球 一 样 诞生 出 丰富 多 彩 的 生命 形态 。 


1990 年 的 某 一 天 ，Tierra 开始 运行 了 。 雷 作为 Tierra 的 “上 禹 ”, 将 一 个 祖先 生命 
程序 段 放 入 了 内 存 中 。 这 个 祖先 程序 只 会 做 一 件 事 情 : 不 停 地 目 我 复制 。 于 是 , 很 快 ， 
小 小 的 内 存 空 间 中 就 挤 满 了 祖先 程序 的 复制 体 。 如 图 11-11a 所 示 , 红色 的 程序 段 就 是 
但 完 程序 。 


由 于 变异 的 作用 , 一 些 祖先 程序 的 变种 很 快 奸 生 了 (图 11-11a 中 红色 之 外 的 程序 
段 )。 然 而 ， 大 部 分 变种 都 是 有 缺陷 的 ， 它 们 要 么 训 无 生存 的 能 力 ， 要 么 不 会 目 我 党 
殖 。 但 不 入 ， 一 种 短小 的 变异 体 出 现 了 (图 11-11a 和 图 11-11b 中 黄色 的 程序 段 )。 它 
们 本 身 并 不 具备 繁殖 自身 的 能 力 , 但 却 可 以 将 自己 的 程序 段 附着 在 一 个 祖先 程序 的 后 
面 ， 同 时 在 祖先 程序 进行 自我 复制 的 时 候 ， 它 们 会 把 执行 指针 抢夺 过 来 复制 自己 ， 而 
非 祖 先 程序 。 它 活 像 一 个 寄生 虫 ， 而 且 比 其 他 程序 更 加 短小 ， 运 行 速度 更 快 。 于 是 ， 
内 存 空间 中 很 快 被 寄生 忠 们 充斥 了 (如 图 11-11b 所 示 )。 


随 看 寄生 虫 的 增多 和 祖先 程序 的 减少 , 大 量 的 寄生 虫 由 于 找 不 到 牡 主 而 快速 地 死 
亡 一 一 没有 人 租 先 程序 的 带 助 ， 它 们 是 不 会 目 我 复制 的 。 然 而 ， 没 过 多 久 , 一 种 新 型 的 
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各色 程序 段 )。 它 们 是 一 种 强大 的 祖先 生命 


的 变种 ， 不 仪 继承 了 祖先 生命 自我 繁殖 的 能 力 ， 而 且 还 具有 抵抗 寄生 虫 的 优良 品质 。 
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图 11-11 


中 图片 来 源 : http://gadzetomania.pl/2012/11/29/wirtualne- stworzenia-alife-hodowla-malych-inteligencji。 


11-11 〈 续 ) 


然而 ,故事 到 这 里 还 没有 结束 。 在 寄生 与 反 寄 生 的 苋 赛 不 停 上 演 的 同时 , 一 类 新 
型 的 关系 在 Tierra 中 诞生 了 : 共生 。 右 干 程序 段 会 通过 相互 调用 从 而 紧密 联系 在 一 起 ， 
形成 稳固 的 组 织 。 


当 雷 把 每 一 时 刻 的 程序 段 数 量 画 成 曲线 , 还 会 发 现 男 一 个 有 趣 的 现象 : 其 点 均衡 。 
这 是 生物 学 家 十 尔 德 ( Gould ) 通过 人 研究 古生物 化 石 发 现 的 一 个 现象 : 地 球 上 的 物种 
会 在 短 时 间 内 突然 爆发 (例如 寒 武 纪 生 物 大 爆发 ) 也 会 在 短 时 间 内 突然 灭绝 。 总 之 ， 
物种 经 历 着 不 连续 的 变化 。 这 同样 在 Tierra 中 出 现 了 。 雷 得 出 结论 : 断 点 均衡 并 不 必 
须 是 外 部 环境 的 突变 引起 的 ( 例如 小 行星 撞击 )， 而 可 能 是 生物 圈 内 复杂 而 非 线性 的 
相互 作用 机 制导 致 的 必然 结束 ， 因 为 在 Tierra 中 并 不 存在 突变 的 环境 。 


复杂 系统 与 复杂 性 科学 
从 奇形怪状 的 生物 形态 ， 再 到 生生 不 息 的 演化 程序 Tierra， 所 有 这 些 活灵活现 的 
人 工 生命 都 具备 如 下 两 种 突出 的 特点 : 


口 规则 简单 ; 
口 表现 行为 极其 复杂 多 变 。 
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例如 ， 写 下 “生命 游戏 ”的 代码 可 能 不 到 一 百 行 , 但 是 如 果 要 用 语言 去 穷尽 “ 生 
命 游 戏 ” 所 演化 出 来 的 各 式 各 样 的 模式 和 花纹 ， 翁 怕 成 千 上 万 行文 字 都 写 不 完 。 人 们 
将 这 种 由 极其 简单 的 规则 萤 仿 了 复杂 表现 的 现象 称 为 涌现 (emergence )。 

简单 地 说 ， 涌 现 可 以 被 描述 为 整体 大 于 部 分 之 和 。 一 些 整体 性 的 模式 或 行为 无 法 
被 归结 为 个 体 的 单独 属性 。 消 现 的 一 个 最 好 的 例子 就 是 我 们 熟悉 的 霓虹灯 ( 见 几 
11-12 )。 我 们 知道 ， 赵 虹 灯 都 是 由 小 灯泡 组 成 的 。 当 我 们 将 目光 锁定 一 个 灯泡 时 ， 会 
发 现 它 们 只 会 在 那里 简单 机 械 地 闪烁 ， 并 没有 太 多 的 含义 。 但 是 ， 当 我 们 将 视线 移 到 
整体 的 层次 ， 观 看 大 量 灯 泡 组 成 的 霓虹灯 整体 的 时 候 ， 我 们 就 会 看 到 有 意义 的 文字 或 
图 像 。 
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11-12 ”过 虹 灯 图片 来 自 www .nipic.com) 


事实 上 ,复杂 系统 中 到 处 都 是 这 类 涌现 现象 。 如 果 我 们 将 系统 简单 地 抽象 为 由 
组 成 单元 (市 点 ) 通过 相互 作用 ( 连 线 ) 而 形成 的 一 个 有 机 整体 ， 那 么 ,复杂 系统 
则 是 特 指 那些 相互 作用 丰富 多 彩 同 时 存在 着 明显 的 非 线 性 特征 的 系统 ， 如 图 11-13 
所 示 。 
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11-13 ”简单 系统 与 复杂 系统 


经 济 、 社 会 、 和 生物、 互联 网 等 都 可 以 看 作 是 复杂 系统 。 而 抛 开 单一 学 科 的 偏见 ， 
及 用 统一 的 视角 人 研究 各 类 复杂 系统 的 共性 与 普 适 规律 的 学 科 就 称 为 复杂 性 科学 。 

目 从 1984 年 ， 美 国 圣 塔 菲 研 究 所 创立 以 来 ， 复 杂 性 科学 已 经 在 各 个 学 科 领 域 开 
花 结果 。 从 多 主体 模拟 ( multi-agent system ) 到 演化 计算 ( evolutionary computation )， 
再 到 后 来 的 复杂 网 络 (complex networks )、 人 类 行为 动力 学 (human dynamics )， 复杂 
性 科学 辐 其 他 学 科 不 断 地 辆 射 着 全 新 的 概念 和 研究 方法 。 


走向 群集 智能 


复杂 性 科学 人 研究 为 人 工 智 能 提供 了 全 新 的 理念 ， 即 智能 这 种 看 起 来 非常 复杂 、 难 
以 预测 的 现象 可 能 来 源 于 某 种 类 似 于 “生命 游戏 ”一 样 的 简单 规则 。 

我 们 人 类 的 大 脑 就 是 一 个 典型 的 复杂 系统 。 每 个 神经 元 仅仅 具备 简单 的 放电 功 
能 ， 然而， 这 些 神经 元 细胞 通过 寞 党 复杂 的 相互 联结 和 作用 构成 了 乔 甘 的 大 脑 。 这 是 
一 个 典型 的 从 催 单 规则 涌现 出 复杂 功能 的 案例 。 事 实 上 ， 神 经 网 络 模型 正 是 沿 春 这 种 
信念 来 展开 和 镶 能 研究 的 ， 在 这 里 我 们 不 做 过 多 的 讨论 。 

然而 ， 智 总 来 源 于 傈 单 的 相互 作用 ， 这 一 认识 并 不 局 限于 人 类 的 大 脑 , 它 同 样 适 
用 于 比 人 类 更 和 商 单 、 低 级 的 生物 一 一 蚂蚁 。 

蚂蚁 可 以 通过 灵敏 的 吊 党 发 现 食物 ， 并 将 这 些 食物 搬 回 家 。 更 令 人 居 奇 的 是 ， 人 研 
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守 人 员 发 现 当 一 群 蚂 玉 搬运 一 大 堆 食 物 的 时 候 , 它们 总 能 找到 食物 与 巢穴 之 间 的 最 短 
搬运 路 径 。 面 对 完全 未 知 的 环境 ， 每 只 蚂 蚁 部 没有 整个 世界 的 地 图 ， 然而， 一 群 蚂 上 由 
是 如 何 做 到 这 一 点 的 呢 ? 


原来 ， 蚂 蚁 在 找到 食物 后 就 会 在 它们 返程 的 路 上 释放 一 种 特殊 的 物质 : 信息 系 。 
其 他 的 蚂蚁 闻 到 了 信息 系 会 很 快 沿 着 第 一 只 蚂蚁 的 路 径 寻 找到 食物 ,并 在 搬运 食物 的 
时 候 继续 往 回 巢 的 路 径 上 播撒 信息 素 ， 如 图 11-14 所 示 。 假 衣 从 虽 穴 到 食物 之 间 有 两 
条 路 径 ， 一 条 长 一 条 短 。 由 于 信息 素 会 逐渐 挥发 ， 于 是 长 度 较 长 的 路 径 在 挥发 邱 信 息 
系 的 同时 却 得 不 到 新 的 信息 系 更 新 。 而 那 条 较 短 的 路 径 由 于 被 重复 的 次 数 较 多 ， 故 而 
记录 下 了 更 浓 的 信息 素 ， 于 是 就 会 有 更 多 的 蚂蚁 被 吸引 过 来 ， 从 而 进一步 加 强 这 条 道 
路 上 的 信息 素 。 台 这 样 ， 通 过 信息 系 的 相互 作用 ， 蚂 蚊 们 找到 了 连接 食物 与 巢穴 之 间 
的 最 短路 径 。 


11-15 ”蚂蚁 砚 食 模拟 程序 〈 监 色 点 为 梨 从 ， 红 色 点 为 食物 ) 〈 另 见 彩 插 ) 
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当 人 们 了 解 了 蚂蚁 群 寻 找 最 短路 径 的 原理 之 后 , 就 可 以 把 这 僚 原 理 用 工程 化 的 方 
法 来 实现 ( 见 图 11-15 )， 从 而 应 用 到 其 他 问题 上 去 。 为 此 ， 计 算 机 科学 家 马尔 科 . 多 
珊 格 ( Marco Dorigo ) 开发 出 了 一 玛 蚂 蚁 群 优化 算法 ( Ant Colony Optimization )， 运 
用 蚁 群 欧 食 的 原理 来 解决 各 类 工程 实践 中 的 优化 问题 。 

无 独 有 个， 模拟 生物 来 解决 各 类 实际 优化 问题 的 算法 还 有 很 多 。 例如 模拟 生物 进 
化 的 著名 的 遗传 算法 和 遗传 编程 ， 以 及 模拟 马 群 欧 食 的 粒子 群 优化 算法 ( Particle 
Swarm Optimization ) 等 。 随 着 这 类 算法 的 涌现 ， 人 们 将 它们 命名 为 一 个 全 新 的 
学 科 : 群集 智能 ( Swarm Intelligence )。 


推 存 阅读 


关于 计算 机 模拟 ,请 参考 《虚实 世界 》 以 及 李 建 会 老师 与 我 合 车 的 一 本 书 《 数 字 
创世纪 : 人 工 生命 的 新 科学 六 这 两 本 书 都 是 科普 书 ， 如 果 读 者 想 碍 找 本 章 叙 述 程序 
的 原始 出 处 ,可 以 参考 人 工 咎 命 第 二 届 会 议论 文集 ， 绝 大 多 数 程序 都 在 这 本 论文 集中 
提 到 。 


关于 复杂 系统 研究 可 以 参考 两 本 正名 为 “复杂 ”的 科普 读物 :《 复 森 : 诞生 于 混 
沌 与 秩序 边缘 的 学 科 》 以 及 《复杂 》 也 可 以 参考 车 名 学 者 、 遗 传 算法 之 父 约翰 霍 
兰 的 几 本 著作 ， 如 《 隐 秩 序 》。 关 于 “生命 游戏 ”， 一 个 很 好 的 探索 工具 是 Life32， 运 
用 这 个 开源 的 程序 ， 你 不 仅 可 以 运行 “生命 游戏 " ， 而 且 能 够 自己 创建 、 编 辑 各 种 模 
式 ， 以 及 下 载 其 他 人 编辑 好 的 模式 。 


关于 涌现 智能 ， 则 可 以 参考 Swarm Intelligence。 如 果 读 者 不 满足 于 入 门 级 的 科普 
读物 ,还 可 以 参考 往年 的 人 工 生命 会 议论 文集 ,以 及 Nature Science Journal of Artificial 
Life 等 期 刊 上 刊登 的 有 关 复 杂 性 科学 人 研究 的 最 新 文献 。 


男 外 ， 如 果 读 者 对 于 简单 程序 非常 感 兴 趣 的 话 ， 请 参考 史 带 分 . 沃 尔 夫 勒 姆 
( Stephen Wolfram ) 的 一 本 符 受 争议 的 巨著 : 4 New Kind of Science。 这 本 书 厚 达 1000 
多 页 ， 却 全 部 在 讨论 各 类 简单 的 计算 机 程序 ， 如 元 胞 自动 机 (“生命 游戏 ”就 是 一 个 
二 维 的 元 胞 自动 机 )、 图 灵机 、 蔡 换 系 统 、 网 络 每 。 沃 尔 夫 勒 姆 认为 ， 他 发 明了 这 些 
简单 的 程序 ， 就 像 当年 伽利略 发 明了 望远镜 ， 它 们 都 打开 了 全 新 的 世界 。 
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谢 广 明 


中 


自然 界 中 存在 着 各 种 各 样 的 群居 生物 ， 如 蚂 蚊 、 候 鸟 以 及 海洋 中 的 许多 鱼 类 。 这 
些 社会 性 动物 个 体 的 行为 相对 简单 ,而 当 它们 聚集 后 , 却 能 够 表现 出 神秘 的 群体 智 丰 
生物 学 家 观察 记录 了 很 多 令 人 惊奇 的 群居 和 牛 物 现象 中。 


生物 群体 


我 们 生活 中 笛 见 的 蚂蚁 ， 看 起 来 非 凋 不 起 眼 , 但 是 由 成 百 上 千 只 蚂 及 组 成 的 蚊 群 
却 可 以 在 从 全 六 到 食物 之 间 的 无 数 可 能 路 径 中 发 现 一 条 最 短 的 路 径 ( 见 图 12-1 )， 并 
且 在 环境 发 生变 化 后 ,例如 当 出 现 隐 人 得 物 阻 断 了 最 优 通 路 时 ， 它 们 又 能 够 很 快 目 发 找 
到 新 的 最 短路 径 。 


再 比如 和 白 疏 ,它们 也 是 成 群 地 生活 ， 并 且 具 有 惊人 的 建造 能 力 。 虽 然 单个 白蚁 缺 
乏 智 慧 上 且 无 统一 指挥 ,但 白蚁 群 却 能 够 建立 起 比 自身 高 大 许多 倍 的 巢穴 ， 上 容纳 成 千 上 
万 的 和 白蚁。 人 梨 穴 的 结构 也 十 分 复杂 ， 具 有 良好 的 保温 和 空气 调节 功能 ， 堪 称 建 筑 学 上 
的 奇迹 ( 见 图 12-2 )。 
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12-2 ”位 于 澳大利亚 的 白蚁 字 〈 图 片 来 自 美国 国家 地 理 网 站 ) 


园 为 人 们 所 熟知 的 例子 是 大 鹰 等 候鸟 在 长 途 迁 徙 过 程 中 ,为 了 市 省 能 量 ， 


能 够 你 


持 特 定 的 “一 ”字形 或 “人 ”字形 队伍 ， 并 且 可 以 目 动 调整 队 形 以 躲避 和 危 辽 或 者 超越 


障碍 ( 见 图 12-3 )。 
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12-3 ”迁徙 中 的 雪 鹰 (图 片 来 自 flickr.com) 
海洋 里 群居 生活 的 鱼 类 也 有 很 多 有 意思 的 群体 行为 , 它们 可 以 组 成 各 种 复杂 美丽 


的 几何 构 型 ， 以 便 充 分 利用 水 流产 生 的 能 量 ; 当 遇 到 效 鱼 等 捕食 者 时 ， 鱼 和 群 还 能 够 形 
成 剧烈 的 洲 滴 来 妃 吓 对 于 ， 抵 抗 攻击 〈《 如 图 12-4 所 示 )。 


12-4 ”海洋 中 的 鱼 群 (图片 来 自 网 络 ) 
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这 些 现象 具有 一 个 共同 的 特征 , 即 一 定数 目的 生物 个 体 通过 个 体 之 间 局 部 性 的 相 
互 影响 和 作用 以 及 对 局 部 环境 的 啊 应 ,涌现 出 群体 层面 的 协调 有 序 的 行为 。 这 种 行为 
通常 被 称 为 群集 行为 (swarming behavior )。 与 单个 个 体 行为 相 比 ， 这 种 群体 上 的 有 序 
行为 具有 很 大 的 优势 ， 能 使 每 个 个 体 获 得 更 大 的 利益 ， 而 这 些 利益 通常 很 难 甚 至 无 法 
通过 单个 个 体 的 努力 得 到 ， 例 如 逃避 天 敌 、 吏 食 生 存 等 。 对 于 这 些 社 会 性 生物 来 说 ， 
每 个 个 体 的 能 力 都 非常 弱小 ， 难 以 单独 存活 ， 而 它们 聚集 在 一 起 后 ， 却 表现 出 强大 的 
生存 能 力 ， 使 得 整个 物种 得 以 延续 发 展 。 


智 朋 


A 
os 
计 


我 们 把 卓然 界 中 这 种 通过 群集 行为 的 方式 所 表现 出 的 能 力 叫 作 群体 智能 ( Swarm 
Intelligence ), 并 把 具有 群集 行为 的 生物 群体 叫 作 智能 群体 (Smart Swarm )。 一般 来 说 ， 
智能 群体 是 指 由 大 量 低 智能 个 体 通过 个 体 之 间 的 局 部 相互 作用 使 得 群体 表现 出 高 智 
能 性 的 动力 学 系统 。 智 能 群体 具有 两 个 显著 特点 : 一 是 个 体 层 面 的 智能 性 低 ， 但 群体 
层面 上 的 智能 性 却 很 高 ; 二 是 虽然 每 个 个 体 都 是 自私 的 , 但 群体 内 部 会 广泛 存在 利他 
性 的 合作 行为 。 和 群体 表现 出 的 智能 不 是 个 体 智 能 的 简单 线性 求 和 ， 而 是 经 由 个 体 之 间 
大 量 的 局 部 相互 影响 相互 作用 后 的 非 线性 车 加 。 


智能 群体 是 一 类 典型 的 自 组 织 系统 。 目 组 织 系统 的 重要 特征 是 群体 本 身 能 够 进行 
目 控 目 调 , 而 不 是 由 一 个 指挥 者 统一 指挥 或 领导 。 群体 首先 通过 个 体 之 间 的 相互 寻找 、 
识别 、 协 同 运作 达到 一 个 稳定 结构 ， 然 后 随 春 环境 的 变化 ， 以 目 身 为 参考 系 不 断 协同 
运作 达到 一 个 新 的 稳定 结构 。 智 能 群体 行为 的 吃 外 一 个 特点 是 异步 并 行 操作 。 和 群体 中 
每 个 个 体 的 决策 与 行动 是 各 目 独 立 的 ， 独 立 进 行 各 目的 调节 更 新 ,没有 先后 顺序 ， 也 
不 需要 同步 进行 。 智能 群体 还 具有 很 强 的 自我 维持 能 力 , 不 会 因为 东 些 个 体 的 死亡 或 
受 损 而 使 得 整个 群体 混乱 或 月 演 。 


下 面 我 们 来 看 看 科学 家 们 模仿 生物 群体 所 设计 实现 的 智能 群体 的 两 个 例子 。 


美国 软件 工程 师 克 雷 格 ， 雷诺 效 在 1987 年 利用 计算 机 程序 模拟 实现 了 自然 界 中 
鸟 群 有 序 的 飞行 。 它 让 每 只 模拟 鸟 在 每 一 时 刻 都 遵循 三 条 法 则 : 避免 与 附近 其 他 成 员 
碰撞 ， 即 分 离 ( separation ); 保持 与 邻近 的 成 员 竺 在 一 起 ， 即 聚合 ( cohesion ); 在 速 
度 上 与 周 于 的 成 员 保持 一 致 ， 即 一 臻 (alignment )。 这 种 基于 个 体 的 简单 算法 ， 却 能 
人 够 在 整体 上 展现 出 乌 群 朝 着 一 个 方向 有 序 飞 潮 的 效果 (如 图 12-5 所 示 )。 
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te 


12-5 ”雷诺 兹 模型 的 模拟 效果 中 


2014 年 ， 哈 佛 大 学 的 人 研究 人 员 设 计 了 一 个 由 1024 个 小 型 机 带 人 组 成 的 系统 。 这 
个 大 规模 的 机 顶 人 群体 能 够 在 没有 人 类 帮助 的 情况 下 , 目 组 织 地 形成 复杂 的 二 维 形 状 
(如 图 12-6 所 示 )。 这 些 被 称 为 Kilobot 的 小 机 篆 人 采用 振动 马达 来 滑行 ， 通 过 红外 线 
在 更 面 上 的 反光 与 其 他 Kilbots 通信 和 感知 距离 。 在 这 些 不 同 寻 名 的 巧妙 设计 基础 上 ， 
研究 人 员 设 计 了 一 个 包含 三 种 初等 集体 行为 的 日 组 织 算法 。 这 三 种 行为 包括 : 机 各 人 
沿 痢 群体 的 边缘 移动 , 机 需 人 能 够 产生 梯度 信息 并 发 送 给 其 他 机 符 人 ,机 华人 通过 通 
信和 距离 检测 来 定位 。 和 群体 中 的 每 个 机 融 人 都 具有 相同 的 算法 程序 ， 并 且 知 道 期 望 的 
二 维 形 状 。 在 机 各 人 实体 设计 和 算法 设计 的 基础 上 ,人 研究 人 员 用 大 规模 机 各 人 群体 实 
现 了 自然 界 中 生物 所 具有 的 通过 集体 行为 形成 复杂 结构 的 能 力 。 


看 到 这 里 ,细心 的 读者 也 许 已 经 注意 到 了 ， 上述 两 个 例子 的 共同 特点 是 ,群体 中 
的 每 个 个 体 都 尽力 执行 给 定 的 行为 规则 , 从 而 产生 群体 层面 上 的 有 序 行为 。 我们 知道 ， 
里 然 智 能 群体 中 个 体 的 智能 性 很 低 , 但 是 它们 都 具有 保护 日 喘 利 益 的 理性 ,期 望 日 喘 
的 利益 能 够 最 大 化 。 这 些 自 私 个 体 的 损 已 利他 行为 ， 我 们 称 之 为 会 作 。 不 难 想象 ， 如 
末 每 个 个 体 都 只 顾 目 己 的 利益 ,不 愿 与 其 他 个 体 合 作 ,， 不 执行 给 定 的 行为 规则 ， 那 么 


整个 群体 就 会 陷入 混乱 与 月 演 ， 从 而 不 会 产生 整体 上 的 有 序 行为 ， 整 个 群体 的 贸 能 性 
也 就 失去 了 根基 。 因 此 ， 和 群体 中 时 刻 保持 有 合作 性 的 相互 作用 是 维系 整个 群体 智能 性 


智 
的 必要 前 提 。 正 是 由 于 这 个 原因 ， 在 前 述 的 两 个 例子 中 ,都 假定 了 每 个 个 体 都 是 合作 
的 ， 都 会 执行 给 定 的 行为 规则 。 


那么 ， 为 什么 群体 中 目 私 的 个 体会 合作 呢 ? 


想 要 的 形状 


想 要 的 形状 


想 要 的 形状 


12-6 
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海星 ，1024 个 机 莫 人 示例 


初始 位 置 。 完成 的 形状 
(用 时 : 11.66 小 时 ) 
(加 速 x1440) 


K 形 ，1024 个 机 器 人 示例 


初始 位 置 完成 的 形状 
(用 时 : 11.71 小 时 ) 
(加 速 x1500) 


扳手 ，5$12 个 机 器 人 示例 


初始 位 置 完成 的 形状 
(用 时 : 5.95 小 时 ) 
(加 束 x 760) 


大 规模 机 器 人 群体 自 组 织 形成 复杂 二 维 形状 
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目 私 与 合作 


个 体 的 合作 行为 会 给 群体 中 其 他 成 员 高 来 好 处 ， 却 会 损害 上 自己 的 利益 。 依据 达 尔 
文 进化 论 原理 ,自然 选择 是 基于 欧 争 的 ， 因 此 个 体 为 了 最 大 化 自 坪 的 利益 会 选择 背 炒 
末 略 ， 这 显然 不 能 解释 智能 群体 中 始终 保持 的 合作 现象 。 演 化 博弈 论 ( Evolutionary 
Game Theory ) 作为 一 个 有 力 的 工具 ， 为 研究 这 一 难题 提供 了 方便 系统 的 框 染 ， 从 无 
限 种 群 到 有 限 种 群 ， 从 没有 网 络 到 有 网 络 ， 从 规则 网 格 到 复杂 网 络 ， 从 前 态 网 络 到 动 
态 网 络 与 博弈 共 演 化 ， 研 究 范围 相当 宽 汉 ， 而 且 成 末 洛 楷 。 


博弈 论 是 依据 其 他 参与 者 的 效用 情况 来 研究 理性 参与 者 策略 之 间 相 互 作 用 的 一 
门 科学 “。 最 经 典 的 博弈 模型 是 办 徒 困 境 博 弈 ” ， 它 揭示 了 社会 两 难 问 题 的 实质 是 个 
体 利益 和 集体 利益 的 冲突 。 办 徒 困境 是 1950 年 美国 兰 德 公 司 提出 的 博弈 论 模型 。 如 
图 12-7 所 示 , 两 个 共 诺 犯罪 的 人 被 关 入 监狱 , 不 能 互相 沟通 情况 。 两 个 人 都 有 两 种 沫 
略 可 以 选择 ， 一 种 是 沉默 (合作 ), 一 种 是 坦 日 捣 发 ( 背叛 )。 如 宁 两 个 人 都 不 揭发 对 
方 , 则 由 于 证 据 不 确定 ， 每 个 人 都 坐牢 一 年 ; 右 一 人 揭发 ， 而 为 一 人 沉 睹 ， 则 揭发 者 
因为 立功 而 立即 获释 ， 沉 默 者 因 不 合作 而 入 狱 二 十 年 ; 在 互相 揭发 ， 则 因 证 据 确 实 ， 
二 者 守 判 刑 五 年 。 由 于 办 徙 无 法 信任 对 方 ， 因 此 倾 问 于 互相 的 发， 而 不 是 同宗 沉 于 。 
这 个 困境 就 在 于 虽然 如 果 二 者 都 选择 合作 ,两 人 坐牢 的 总 年 数 只 有 两 年 ,为 最 小 ,但 
是 往往 因为 担心 对 方 坦 白 让 自己 承担 巨大 风险 而 自己 也 宁愿 选择 背叛 , 于 是 两 人 坐牢 
的 总 年 数 变 为 十 年 ， 双 方 的 利益 都 爱 损 。 


其 他 博弈 模型 还 有 雪 堆 博弈、 猎 鹿 博弈、 最 后 通 幅 博弈 、 少 数 者 博弈 、 石 头 前 刀 
呵 | 奸 
十 


布 博弈 以 及 公共 品 博弈 等 ”。 


演化 博弈 论 是 博弈 论 与 生物 进化 论 结合 发 展 起 来 的 产物 “。 演 化 博弈 论 是 以 种 群 
为 研究 对 象 分 析 种 群 中 个 体 生 略 的 动态 演化 过 程 。 种 群 的 策略 演化 过 程 既 有 选择 过 程 
又 有 突变 过 程 。 个 体 在 演化 过 程 中 与 其 他 所 有 个 体 进行 博 论 交互 从 而 获取 收益 ， 即 适 
应 度 。 在 目 然 选择 的 作用 下 ， 适 应 度 越 蜗 的 个 体 ， 它 的 策略 越 容易 被 模仿 或 者 遗传 ， 
并 能 够 最 终 发 展 成 为 所 请 的 演化 稳定 末 略 。 值 得 一 提 的 是 ， 这 里 演化 稳定 失 略 的 定义 
是 针对 个 体 数 量 无 限 大 的 种 群 ， 诺 瓦 克 等 人 ”给 出 了 在 种 群 中 个 体 数量 有 限 的 情况 下 
相应 的 演化 稳定 素 略 定义 ， 进 一 步 发 展 了 演化 稳定 末 略 的 理论 。 


泰勒 特 . 琼 克 ( Taylort Jonker ) 外 在 考察 生态 演化 现象 时 首次 提出 了 演化 博弈 论 的 
基本 动态 概念 复制 动力 学 。 在 复制 动力 学 中 ,假定 种 群 中 每 种 策略 分 布 比例 的 变 
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化 率 既 正比 于 此 策略 的 分 布 比例 ,又 正比 于 采用 此 策略 个 体 的 平均 适应 度 与 所 有 个 体 
的 平均 适应 度 之 差 。2006 年 话 瓦 元 在 前 人 人 研究 成 果 的 基础 上 ， 在 Science 上 发 表 综 述 
文章 ， 总 结 提出 了 五 种 有 利于 合作 演化 的 机 制 … : 亲缘 选择 、 直 接 互惠 、 间 接 互 惠 、 
网 络 互惠 和 和 群 选择 。 此 外 还 有 其 他 一 些 机 制 ， 如 奖赏 和 处 罚 ， 基 于 个 体 表 现 型 特征 
的 合作 等 也 得 到 了 人 们 的 关注 和 研究 。 


办 徒 困境 


过 


保持 沉默 


保持 沉默 上 


La 里 居 | | La _ | 加 | 


12-7 ” 因 徒 困境 示意 图 (图片 来 自 网 络 ) 


自 诺 瓦 克 提出 平面 方 格 上 的 演化 内 徒 困境 博弈 〈 如 图 12-8 所 示 ) 以 来 ， 网 络 
上 的 演化 博 罕 动力 等 受到 了 广泛 的 关注 。 作 为 一 种 有 效 的 合作 演化 机 制 ， 网络 理论 为 
描述 种 群 中 个 体 之 间 的 连接 关系 提供 了 方便 的 框 氏 。 网 络 上 的 节点 代表 博弈 个 体 , 边 
代表 个 体 与 邻居 之 间 的 连接 博弈 关系 。 
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图 12-8 ”平面 网 格 上 的 合作 演化 仿真 图片 来 自 文献 1) 


近年 来 ,动态 网 络 上 的 合作 演化 也 得 到 了 比较 广泛 的 关注 。 个 体 通过 与 邻居 的 博 
穿 交 互 可 以 获取 一 定 的 信息 。 这 些 信息 的 反馈 不 仅 可 以 帮助 个 体 进行 委 略 调整 ， 还 可 
以 帮助 个 体 调 整 相应 的 连接 博 穿 关系 ， 从 而 更 好 地 反映 了 真实 系统 的 本 质 特征 。 在 这 
种 共 演 化 规则 下 , 一 方面 种 群 中 个 体 的 合作 行为 在 动态 地 演化 ,为 一 方面 种 群 中 个 体 
之 间 的 连接 博弈 关系 也 在 发 生 改 变 ， 两 者 互 为 反馈 、 相 互 作 用 ， 最 终 能 够 使 合作 行为 
涌现 并 使 真实 种 群 结构 出 现 。 
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机 情人 群体 


在 对 “为 什么 合作 ”这 个 问题 进行 探索 之 后 ， 新 的 问题 产生 了 : 合作 一 定 是 对 
群体 最 有 利 的 吗 ? 如 果 个 体 并 非 完全 合作 ， 而 是 表现 出 一 定 程度 的 目 私 ， 会 发 生 什 
么 呢 ? 


为 了 回答 这 个 问题 ,我 们 以 多 机 天 人 环形 编队 控制 为 例 ， 给 出 一 种 研 守 智能 群体 
理论 与 应 用 的 探 过 尝试。 


首先 给 出 多 机 融 人 环形 编队 控制 的 具体 描述 。 假 设 系统 有 V 个 机 融 人 , 它们 初始 
分 布 在 一 个 给 定 的 圆 环 轨道 上 ， 并 且 只 能 在 这 个 圆 环 上 运动 。 它 们 对 圆 环 的 方向 ( 顺 
时 针 方向 ) 有 共同 的 认 知 。 每 个 机 器 人 都 是 匿名 的 , 因此 机 闫 人 无 法 区 分 其 他 机 需 人 。 
这 里 ， 为 了 表述 方便 ， 我 们 按照 逆 时 针 方 回 从 1 到 对 其 进行 编号 ， 如 图 12-9 所 示 。 


12-9 多 机 器 人 的 环形 编队 


在 我 们 所 选取 的 固定 的 坐标 系 中 , 用 x(D) 表 未 第 i 号 机 各 人 在 1 时 刻 的 位 置 。 每 个 
机 符 人 只 能 感受 它 前 后 两 个 机 釉 人 的 相对 位 置信 息 ， 我 们 用 N={ 一 门 表 示 第 i 号 机 
信人 的 邻居 集合 。 那 么 有 
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我 们 用 4; 来 定义 第 i 号 机 如 人 和 它 的 邻居 广 之 间 的 期 望 距离 。 于 是 ， 期 望 环 形 编 
队 可 以 由 问 量 4 完全 确定 ,d= [di, q;…, dw]。 我 们 称 满足 4;>0 且 d1+qd;+…+dy= 2x 
的 期 望 环形 编队 是 可 容许 的 ， 只 有 可 允许 的 队 形 才 可 以 实际 实现 。 

我 们 假设 机 大 人 的 动力 学 模型 为 最 简单 的 单 积 分 带 形 式 : 

X(t)=u,(t) 

其 中 ,wi 是 控制 输入 函数 ， 也 就 是 我 们 需要 设计 的 部 分 。 用 y; 来 定义 第 i 写 机 各 人 和 
它 的 邻居 大 之 间 的 实际 距离 。 那 么 所 谓 环形 编队 控制 问题 就 是 仅 利 用 邻居 之 间 的 实际 
距离 和 期 望 距 离 等 信息 ， 针 对 每 一 个 机 禹 人 设计 一 个 欣 制 输入 困 数 丰 ， 让 所 有 机 禹 人 
最 终 达 到 期 望 的 间距 。 

特别 需要 指出 ， 根 据 候 设 ， 每 个 机 器 人 都 不 可 能 知道 所 有 机 器 人 的 信息 ， 只 能 和 
用 局 部 邻居 信息 ， 所 以 wi 只 能 是 yy，y，di 和 di 的 函数 。 我 们 从 理论 上 严格 证 明 ， 按 
照 以 下 形式 给 出 的 控制 输入 函数 可 以 解决 环形 编队 控制 问题 。 


EE a ;2 N 
U. 1 一 2 I 一 2 I 7 E i 


<A 


我 们 在 前 面 提 到 ， 大 雁 能 够 保持 特定 的 “一 ”字形 或 “人 ”字形 队伍 以 节省 群体 
的 能 量 ， 鱼 类 可 以 组 成 复杂 的 几何 构 型 以 便利 用 水 流产 生 的 能 量 ， 这 些 都 是 生物 群体 
中 产生 的 群集 行为 能 够 慷 省 群体 能 量 的 典型 例子 。 受 到 这 一 现象 的 启发 ， 我 们 尝试 回 
归 智 能 群体 系统 的 本 源 ， 借 助 智能 群体 系统 的 研究 起 源 一 一 群体 智能 的 特点 ， 来 解决 
多 机 上 六 人 编队 控制 系统 的 能 耗 优化 问题 。 


我 们 知道 ， 目 组 织 + 自私 个 体 是 群体 智能 的 重要 特征 。 一 方面 ,群体 中 的 个 体 只 
是 芝 循 简单 的 规则 ， 丈 能 够 使 群体 中 涌现 出 复杂 且 有 效 的 群集 行为 ， 即 自 组 织 。 为 一 
方面 ， 生 物 群 体 中 的 个 体 都 具有 目 私 的 本 性 ， 都 是 期 望 目 身 利 益 最 大 化 的 理性 个 体 ， 
而 合作 行为 却 能 够 在 自私 个 体 间 演 化 产生 并 最 终 在 整个 种 群 中 涌现 。 


多 机 和 仙人 环形 编队 控制 系统 已 经 具有 日 组 织 的 特点 , 系统 中 的 每 个 机 各 人 执行 给 
定 的 基于 局 部 信息 的 控制 输入 函数 ， 从 而 使 整个 系统 完成 期 望 的 环形 编队 ,这 就 是 群 
体 智能 中 “ 自 组 织 ” 的 具体 体现 。 但 是 ， 每 个 机 毅 人 并 没有 目 私 的 属性 。 如 果 给 每 个 
机 逢 人 赋 子 目 私 的 属性 一 一 为 了 节省 上 自身 能 量 ， 个 体 不 希望 移动 过 长 的 路 程 。 基 于 此 
假设 ,自私 的 个 体 不 再 严格 执行 事先 设 定 的 控制 函数 ， 而 是 有 所 保留 。 此 时 会 有 什么 
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情况 发 生 呢 ?还 能 形成 期 望 队 形 吗 ? 整 个 系统 的 能 耗 能 降低 吗 ? 


为 了 描述 这 个 目 私 的 属性 ， 我 们 引入 策略 函数 s; 的 概念 。s; 定 量 地 刻画 了 个 体 的 
目 私 属性 : 个 体 策略 值 越 低 则 表示 个 体 的 日 私 程度 越 蜗 ( 合作 程度 越 低 )， 而 个 体 策 
略 越 高 则 表示 个 体 的 目 私 程度 越 低 〈 合 作 程度 越 高 )， 当 个 体 策 略为 1 时 ， 表 示 该 个 
体 肝 全 合作 。 相 应 地 ， 系 统 中 个 体 的 平均 策略 可 以 看 作 系统 的 目 私 程度 。 此 时 ， 机 顶 
人 的 动力 等 方程 楼 为 


计 (1) = (Du (0) 


当 我 们 随机 给 每 个 s; 取 [0, 1] 之 间 的 数值 时 , 也 就 是 每 个 机 器 人 都 有 不 同 程度 的 自 
私 属 性 时 ， 我 们 通过 大 量 仿 真实 验 发 现 ， 在 大 多 数 情 况 下 ， 编 队 最 终 仍然 能 够 实现 ， 
而 且 所 有 机 需 人 走 过 的 平均 路 程 和 平均 编队 完成 时 间 的 乘积 (系统 总 能 耗 的 一 种 体 
现 ) 却 大 大 降低 ! 


进一步 地 , 我们 以 一 次 环形 编队 任务 为 一 次 博 穿 过 程 ， 定义 机 带 人 走 过 的 路 程 总 
和 的 相反 数 为 机 各 人 的 收益 ， 即 走 过 的 路 程 越 长 ， 收 益 越 低 。 为 简化 模型 ， 我们 限定 
每 个 机 器 人 的 策略 是 一 个 有 限 集合 {0,0.1,0.2,…….,0.9,1}。 每 执行 一 次 编队 任务 ， 就 是 一 
次 博 穿 。 之 后 ， 每 个 机 各 人 计算 各 日 的 收益 ,然后 和 两 个 邻居 的 收益 相 比 较 ， 选取 收 
益 较 大 的 机 硕 人 作为 学 习 的 对 象 ， 以 一 定 的 概率 调整 目 己 的 策略 值 回 其 靠近 0.1， 这 
样 构成 一 个 完整 的 演化 博 蛮 模型 。 


基于 上 述 提出 的 演化 博 讲 模型 ， 我 们 分 别 对 N= 4; 5; 6; 9; 12; 15; 18; 19; 20 的 情 
况 , 人 研究 系统 中 刻画 个 体 目 私 程度 的 策略 的 演化 。 对 于 每 一 个 X 的 取 值 ,我 们 都 进行 
1000 次 的 独立 数值 仿真 实验 , 并 把 种 群 演化 到 全 部 是 某 一 宋 略 值 的 次 数 比 例 作 为 衡量 
系统 日 私 程度 的 指标 。 下 面 分 别 介绍 两 类 实验 及 其 结果 。 


随机 初 值 实验 结果 


首先 , 假设 每 个 机 絮 人 的 策略 是 随机 取 值 于 集合 {0,0.1,0.2,.….,0.9,1} 的 ， 演 化 结 
如 图 12-10 所 示 。 我 们 发 现在 不 同 的 YX 的 取 值 下 ， 种 群 的 策略 总 是 以 很 大 概率 稳定 到 
较 小 的 策略 值 上 ， 且 概率 的 峰值 总 是 出 现在 0.3 或 0.4 处 。 具 体 而 言 ， 当 N= 4; 5; 6; 9; 
12 时 ， 概 率 的 峰值 为 0.4 且 回 两 边 递减 ; 当 N= 15; 18; 19; 20 时 ， 概 率 的 峰值 为 0.3， 
日 分 布 更 为 集中 。 
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图 12-10 ”随机 初 值 演化 结果 横 轴 表示 个 体 策略 值 ， 纵 轴 表 示 演化 到 全 部 是 某 一 策略 值 的 次 数 ) 
根据 上 面 给 出 的 数值 结果 ， 我 们 可 以 发 现 : 


口 种 群 稳 态 时 总 是 倾向 于 具有 较 低 的 合作 水 平 ， 即 较 高 的 目 私 程度 ; 

口 出 现 概率 最 大 的 种 群 目 私 程度 并 非 最 小 的 策略 值 0.1， 而 是 较 小 的 琐 略 值 0.3 
或 0.4; 

口 种 群 中 个 体 的 数目 对 种 群 的 自私 程度 有 一 定 影响 , 随 着 个 体 数 目的 增加 , 种 
群 的 目 私 程度 略 有 提高 ， 且 更 为 集中 。 
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策略 入 侵 实 验 

为 了 进一步 分 析 上 自私 策略 在 系统 中 的 演化 ， 我 们 分 别 研究 自私 程度 较 高 的 个 体 
是 否 能 够 入 侵 自 私 程度 较 低 的 群体 ， 以 及 自私 程度 较 低 的 个 体 是 否 能 够 入 侵 自 私 程 
度 较 高 的 群体 。 对 于 前 者 ， 我 们 随机 在 系统 中 选取 一 个 个 体 ， 赋 予 其 较 高 的 自私 程 
度 , 若 NW=4;5$;6;9;12 (或 N=15; 18; 19; 20 )， 取 其 策略 值 为 0.4 (或 0.3 )， 其 余 个 
体 具 有 较 低 的 自私 程度 ， 取 策略 值 1。 类 似 地 ， 对 于 后 者 ,我 们 随机 在 系统 中 选取 一 
个 个 体 ， 赋 予 其 较 低 的 自私 程度 ， 取 其 策略 值 为 1， 其 余 个 体 具有 较 高 的 自私 程度 ， 
若 和 N= 4; 5; 6; 9; 12 (N= 15; 18; 19; 20 )， 取 策略 值 0.4 (0.3 )。 结 果 分 别 如 图 12-11 
和 图 12-12 所 示 。 


N=4 N=5 N=6 
0.5 0.5 0.5 
0.4 0.4 | 0.4 
0.3 0.3 0.3 
0.2 0.2| 0.2 
0.1 0.1 0.1 
0 0 0 
0 0.5 1 0 0.5 1 0 0.5 1 
N=9 N= 12 N= 15 
0.5 0.5 0.5 
0.4 0.4 | 0.4 
0.3 0.3| 0.3 
0.2 0.2| 0.2 
0.1 0.1 0.1 
0 0 
0 0.5 1 0 0.5 1 
N= 18 N= 20 
0.5. 0.5， 
0.4 0.4 | 0.4 
0.3 0.3 0.3 
0.2 0.2| 0.2 
0.1 0.1 0.1 
0 
0 0.5 1 0 0.5 1 0 0.5 1 


12-11 ”自私 程度 较 低 的 种 群 中 出 现 自私 程度 较 高 的 个 体 的 情况 〈 模 轴 代 表 个 体 
的 策略 值 ， 纵 轴 代 表 种 群 演化 到 全 部 是 某 一 策略 值 的 次 数 比例 ) 
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图 12-12 ”自私 程度 较 高 的 种 群 中 出 现 自私 程度 较 低 的 个 体 的 情况 〈 横 轴 代 表 个 体 
的 策略 值 ， 纵 轴 代表 种 群 演化 到 全 部 是 某 一 策略 值 的 次 数 比例 ) 

从 图 12-11 中 可 以 清晰 地 看 到 ， 在 不 同 的 YX 的 取 值 下 ， 自 私 程度 较 低 的 种 群 中 ， 
一 旦 出 现 一 个 自私 程度 较 高 的 个 体 ， 那 么 种 群 的 自私 程度 也 会 以 很 大 概率 增加 ， 且 概 
率 的 峰值 总 是 出 现在 0.6 或 0.7 处 。 相 应 地 ， 从 图 12-12 中 可 以 看 到 ， 自 私 程度 较 高 的 
种 群 中 , 即使 出 现 一 个 自私 程度 较 低 的 个 体 , 种 群 仍然 以 很 大 概率 保持 原 有 自私 程度 ， 
上 且 当 个 体 数 目 超 过 9 以 后 ， 这 个 概率 在 90% 以 上 。 根据 上 面 给 出 的 数值 结果 ， 我 们 可 
以 发 现 : 

口 自私 程度 较 低 的 种 群 , 很 容易 被 自私 程度 较 高 的 个 体 入侵 , 从 而 导致 种 群 的 自 

私 程度 增加 ; 
口 而 自私 程度 较 高 的 种 群 ， 很 难 被 自私 程度 较 低 的 个 体 入 侵 ; 
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口 当 个 体 数 目 大 于 9 时 ， 目 私 程度 较 高 的 种 群 几 乎 总 是 能 够 维持 原 有 的 自私 程 
度 ， 从 而 导致 人 侵 的 目 私 程度 较 低 的 个 体 无 法 生存 。 
综合 以 上 绪论, 我 们 可 以 发 现 , 具有 目 私 属性 的 多 个 体系 统 总 是 倾 癌 于 具有 较 低 
的 合作 水 平 ， 也 即 较 遍 的 目 私 程度 。 
更 详细 的 研究 结果 ， 请 参阅 文献 “。 这 个 研究 最 有 意思 的 一 点 是 , 通常 人 们 一 般 
的 理解 都 认为 目 私 是 不 好 的 属性 ,对 团队 合作 是 不 利 的 因素 。 但 是 我 们 的 研究 结 末 却 
发 现 ， 对 机 硕 人 系统 引入 目 私 的 属性 ， 反 而 让 机 硕 人 群体 工作 起 来 品质 更 好 了 。 


机 器 和 动物 的 竟 合 群体 


我 们 已 经 知 站 ,生物 群体 的 群集 行为 引发 了 科学 家 对 智能 群体 的 研究 ， 而 机 融 人 
群体 作为 智能 群体 的 一 个 实例 ， 已 经 开始 被 探索 和 应 用 。 那 么 ， 如 果 将 机 融和 动物 放 
在 一 个 群体 中 ， 又 会 发 生 什 么 呢 ? 


2007 年 ，Science 上 发 表 了 一 篇 有 意思 的 论文 ， 其 研究 结果 受到 广泛 关注 。 研 
究 人 员 把 一 种 虹 螂 机 天 人 混和 人 真 丹 螂 群体 中 。 虹 螂 机 天 人 外 形 上 不 像 蜂 螂 ,外 表 歼 了 与 
真 昱 螂 号 体 表 面 的 化 学 组 成 成 分 类 似 的 涂 层 , 让 真 螃 螂 确信 这 是 目 己 的 同类 。 蜂 螂 成 群 
活动 ， 辟 欢 黑暗 。 它 们 的 行为 受 两 个 因素 的 影响 : 伙伴 的 行为 和 环境 的 因素 。 当 面 对 明 
首 不 同 的 两 个 藏 喘 地 点 时 , 被 科学 家 们 控制 的 几 个 昱 螂 机 天 人 选择 了 亮 一 些 的 去 处 。 尽 
管 行为 稍 显 寞 第 ,但 机 人 各 人 却 成 功 地 影 啊 了 整个 蜂 螂 群 ， 大 家 也 跟着 前 往 ( 如 图 12-13 
所 示 )。 实 验 结 果 表 明 ， 通 过 程序 控制 的 丹 螂 机 器 人 能 明显 影响 整个 暗 螂 群体 的 行为 。 


30 mm 


12-13 ”机 器 蜂 旺 影响 了 真正 蜂 旺 的 选择 


274 ， 科 学 的 极致 : 漫谈 人 工 智能 


2008 年 , 人 研究 者 用 细 线 拉动 鱼 形 玩偶 在 水 中 移动 ,模拟 鱼 的 游 动 ， 也 对 鱼 群 的 走 
向 产生 了 影响 “-2010 年 ,一 些 生物 学 家 指出 可 以 用 机 器 鱼 来 分 析 鱼 群 的 群体 行为 “。 


这 些 有 趣 的 研究 表明 ,混入 仿生 机 各 人 的 生物 群体 ， 同 样 能 够 产生 群体 行为 ， 并 
且 仿 生机 各 人 能 够 明显 影响 整个 生物 群体 的 行为 。 


为 了 进一步 验证 这 一 结论 , 我 们 将 目 主 开发 的 仿生 机 各 鱼 放 入 了 北京 大 学 未 名 湖 
中 ， 结 果 湖 中 的 鱼 儿 被 机 右 鱼 所 吸引 ， 成 群 结 队 地 跟 在 机 带鱼 里 后 游 飞 ( 如 图 12-14 
所 示 )。 虽然 在 意料 之 中 ,但 这 一 现象 还 是 足够 令 人 慰 奇 。 我 们 初步 看 到 了 机 可 人鱼 对 
真 鱼 产生 了 影响 , 这 说 明 机 带鱼 在 某 种 程度 上 受到 了 真 鱼 的 认可 ， 在 个 体 仿生 的 层面 
上 ， 我 们 取得 了 一 定 的 成 功 。 我 们 希望 进一步 在 群体 仿生 的 层面 上 也 可 以 取得 成 功 。 


12-14 ”未 名 湖 里 的 机 器 鱼 〈 黑 色 ) 带动 了 真正 的 鱼 群 〈 红 色 ) 《〈 另 见 彩 插 ) 


本 章 介 绍 了 人 工 智 能 的 一 个 重要 方 癌 一 一 智能 群体 的 理论 与 应 用 的 研究 内 容 和 
发 展 。 目 前 这 个 方向 的 研究 还 非常 初步 ， 特 别 是 缺乏 多 学 科 的 交叉 研究 ,我们 通过 一 
个 简单 的 机 器 人 编队 控制 的 问题 可 以 发 现 智能 群体 理论 的 巨大 价值 。 这 类 研究 的 本 质 
是 “ 师 法 自然 ”。 大 自然 是 我 们 的 好 老师 ， 即 使 是 看 起 来 不 起 眼 的 小 蚂蚁 ， 也 值得 我 
们 敬重 和 学 习 。 
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第 13 董 也 克星 计划 : 创造 一 个 二 体 世 和 界 
范 明理 


想 参 力 比 知识 更 重要 。 因 为 知识 是 有 限 的 ,而 想象 力 概括 着 世界 的 一 切 ， 
推动 着 进步 ， 并 且 是 知识 进化 的 源 录 。 
可 尔 伯 特 ， 爱 因 斯 坦 


蓝 色 的 家 园 不 只 一 个 ， 甚 至 宇宙 也 不 只 一 个 。 窗 外 的 大 千 世 界 ， 上 映射 人 我 们 计算 
的 水 品 球 里 ， 于 是 我 们 便 看 到 了 为 一 个 宇宙 里 的 蓝 色 星球 一 一 岂 殉 星 。 


瓦 克 星 比 地 球 稍 大 ( 见 图 13-1 )， 半 径 有 8388 余 公里 ， 和 地 球 一 样 ， 上 面 有 高 管 
人 人 云 的 山峰 和 波涛 测 涌 的 海洋 。 然 而 瓦 克 星 和 地 球 也 有 非常 大 的 差异 ， 它 位 于 一 个 双 
星系 统 里 ， 围 绕 着 它 的 两 颗 母 星 旋转 。 


图 13-1 地球 和 瓦 克 星 的 大 小 对 比 


当 飞 船 飞 临 瓦 克星 的 上 空 时 , 我 们 看 到 能 窗外 的 星球 并 非 一 个 完美 的 月 牙 形 或 者 
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半圆 ， 而 是 半圆 斜 挂 出 一 角 ( 见 图 13-2 )， 这 提醒 着 我 们 来 到 了 一 个 不 同 的 世界 。 
瓦 克 星 ， 我 们 来 了 ! 


13-2 ”飞船 飞 临 瓦 克星 上 空 看 到 的 景象 


计划 的 缘起 


小 说 《三 体 》 是 作家 刘 慈 欣 的 科幻 作品 ， 故 事 发 生 在 离 地 球 最 近 的 半 人 马 座 的 
三 体 星 系 中 。 有 一 天 我 在 图 书馆 翻 看 《三 体 》 的 介绍 时 ， 心 头 突然 萌生 了 一 个 问题 : 
三 体 的 世界 非 背 不 稳定 ， 对 于 军 宙 里 非常 普 过 的 双星 系统 ， 其 中 的 行星 世界 会 是 怎 
样 的 呢 ? 

被 这 个 问题 强烈 地 吸引 着 , 我 做 了 一 系列 的 计算 机 模拟 ,逐渐 对 这 样 一 个 世界 有 
了 一 定 的 认识 。 于 是 产生 了 一 个 更 大 胆 的 想法 : 建立 一 个 开源 项 目 ， 通 过 模拟 一 个 有 
两 个 太阳 的 行星 世界 ， 以 及 行星 上 面 的 海洋 、 山 川 、 光 、 热 、 风 、 雨 甚至 生命 ， 来 促 
进 物 理 、 数 学 和 计算 机 知识 的 教育 。 

于 是 我 们 启动 了 瓦 克 星 计 划 项目 , 并 建立 了 专门 的 网 站 站。 虽然 , 到 目前 为 止 ， 
这 个 项 目 在 进展 中 遇 到 了 很 多 困难 , 但 也 初步 取得 了 一 些小 的 成 果 。 下 面 我 们 将 对 探 
索 过 程 中 遇 到 的 问题 、 思 考 和 结果 进行 详细 介绍 。 


建构 世 弄 的 路 径 


模拟 一 个 新 世界 这 件 事情 听 起 来 很 酷 , 但 要 怎么 人 手 呢 ? 我 们 设想 了 一 条 由 人 简易 
到 复杂 的 路 径 。 
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口 恒星 系 建 模 : 目标 是 建立 一 个 稳定 而 宜 居 的 行星 轨道 。 
D 行星 建 醒 : 涉及 行星 表面 物理 机 制 的 建 模 ， 比 如 地 表 特 征 、 大 气 环流 、 洋 流 、 
天 人 气 现象 、 漳 汐 等 。 
口 生物 圈 建 模 : 行星 建 模 会 设 定好 行星 上 不 同 地 点 的 水 、 光 、 热 等 条 件 ， 这 样 才 
能 给 生物 建 醒 提供 条 件 。 
在 计划 执行 过 程 中 , 最 大 的 困难 在 于 征集 合适 的 志愿 者 。 这 些 志 愿 者 要 有 足够 的 
科学 背景 ， 能够 熟练 地 掌握 计算 工具 ， 同 时 还 要 有 足够 的 业余 时 间 和 兴趣 。 目 前 计划 
进展 到 了 行星 建 模 阶 段 ， 正 在 尝试 解决 天 气 的 模拟 。 


恒星 系 的 建 模 


恒星 系 建 模 的 目标 是 为 行星 建构 出 一 个 稳定 的 宜 居 轨道 , 主要 围绕 “稳定 ”和 “ 宜 
大 ”两 个 于 问题 展开 。 


动力 学 基础 
下 面 我 们 先 从 星体 的 动力 学 方程 开始 讨论 。 我 们 指定 两 颗 恒 星 的 下 标 分 别 是 1 和 


2, 行星 的 下 标 为 3, 于 是 三 个 星体 的 质量 分 别 是 mm、m2、m3, 位 置 分 别 是 矢量 x1、x、 
Xx3。 因 为 行星 质量 m3 远 小 于 两 个 恒星 的 质量 ， 所 以 可 建立 如 下 限定 性 三 体 问题 站 的 运 
动 方程 : 


9 
Xl Gm,7) C1» 


2 
2 Gm n, 613 


认 = 
% GMN C1 GMm, nn) C2 


其 中 为 星体 i 和 j 之 间 的 距离 ，e; 为 星体 i 和 j 之 间 的 单位 方向 矢量 。 


稳定 轨道 的 解 算 


三 体系 统 在 很 多 情况 下 是 不 稳定 的 ， 篆 篆 会 有 一 颗 星 体 被 抛射 到 无 穷 过 处 。 图 
13-3 便 是 三 体 体系 的 一 个 著名 例子 一 一 毕 达 哥 拉 斯 三 体 问题 “的 轨道 演化 图 。 两 颗 质 
量 较 大 的 星体 相互 围绕 旋转 下 行 ， 而 质量 最 小 的 第 三 颗 星 体 则 被 忆 出 ， 沿 着 双 曲 线 
4 
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图 13-3 ” 毕 达 哥 拉 斯 三 体 问 题 (图 片 来 自 Greg Laughlin") 


运动 方程 建立 之 后 , 便 可 以 对 这 个 二 阶 第 微分 方程 进行 数值 求解 。 理 论 上 讲 , 我 
们 忽略 了 行星 的 质量 会 让 系统 的 稳定 性 提高 很 多 的 问题 。 我 们 用 最 帝 用 的 数值 求解 方 
法 一 一 龙 格 - 库 塔 法 "求解 了 该 问题 , 但 发 现 由 于 误差 的 积累 效应 , 整个 体系 不 保持 能 
量 守 恒 。 于 是 ， 大 多 数 情况 下 ， 三 星体 体系 不 稳定 ,行星 会 很 快 被 抛 出 双星 系 。 


这 种 不 符合 能 量 守 恒 的 计算 解 中 的 能 量变 化 ， 被 称 为 能 量 漂移 "| ( energy drift )。 
为 了 消除 能 量 漂移 ， 人 们 引入 了 辛 方法 “来 计算 此 类 问题 。 辛 方法 会 保持 系统 的 能 量 
守恒 。 我 们 在 这 里 采用 了 一 种 二 阶 的 辛 方法 Verlet 积分 “。 采 用 Verlet 积分 方法 之 后 ， 
束 很 容易 计算 出 一 条 稳定 的 轨道 了 。 
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天 球 系统 
为 了 更 好 地 陈述 后 面 几 市 ， 我 们 以 地 球 的 天 球 系统 为 基础 展开 讨论 。 


天 球 0 是 一 个 假想 的 以 行星 地 心 为 球 心 的 几何 球面 , 行星 自转 导致 恒星 ( 母 星 和 
背景 星空 ) 在 天 球 上 有 以 天 为 单位 的 周 日 运动 , 行星 公转 导致 恒星 在 天 球 上 有 以 年 为 
单位 的 周年 运动 。 地 球 天 球 示 意图 见 图 13-4。 


垂直 干 轨道 面 ,世人 级 


村 角 /自转 名 


天 球 赤 道 


/ 


南天 极 


13-4 ”地 球 天 球 的 示意 图 


地 球 上 天 球 的 主要 几何 元 素 包 括 以 下 几 种 。 


口 前 、 北 天 极 : 它们 的 指向 长 时 间 稳 定 。 

口 赤道 面 : 以 极 轴 为 法 线 的 大 圆 面 。 

口 页 道 面 : 本 系统 恒星 周年 运动 所 在 的 平面 。 

口 黄 赤 交角 : 数值 上 等 同 于 行星 的 日 转轨 诞 倾 角 。 


同样 地 ,在 有 岂 殉 星 上 也 会 有 以 上 几何 元 系 。 不 一 梓 的 地 方 在 于 ,黄道 上 有 两 颖 母 
星 沿 着 它 运动 。 和 地 球 类 似 ,恒星 的 周 日 运动 依然 存在 ,但 周年 运动 则 大 相 径 姓 。 鉴 
于 两 烽 母 星 的 周年 运动 轨迹 比较 复杂 ， 这 里 仅 作 简单 介绍 ， 不 作 过 多 讨论 ， 感 兴趣 的 
读者 可 参考 相关 人 研究 。 
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昼夜 现象 


昼夜 现象 是 由 三 颗 星 体 和 行星 的 旋转 轴 之 间 的 相对 几何 关系 确定 的 。 容易 想到 在 
行星 的 球体 表面 上 ， 每 一 个 母 星 都 对 应 一 个 昼夜 变更 的 大 圆 C 和 CC， 它们 对 应 圆 面 
D1 和 D;, 的 法 线 方 回 分 别 是 el 和 e。 容 易 看 出 DimnD: 是 黄道 面 8 的 法 线 。 


与 昼夜 现象 的 时 间 周 期 相 比 , 我 们 可 以 不 考虑 岁差 现象 。 如 同 地 球 上 的 北极 指 
癌 长 期 你 持 在 北极 星 附 近 ， 瓦 区 星 的 旋转 轴 疡 也 是 长 期 相对 稳定 的 。 艾 道 面 五 的 法 线 
就 是 旋转 轴 p。 

将 以 上 关系 进行 编程 ,很 容易 就 可 以 模拟 出 瓦 克 星 上 的 异 夜 现象 。 那么 瓦 殉 星 上 
的 昼夜 现象 有 什么 特别 之 处 吗 ?” 通 过 模拟 我 们 发 现 , 一 年 中 会 有 短暂 的 几 天 ， 瓦 克星 
的 南北 两 极 同时 处 于 极 慎 之 中 ( 见 图 13-5 )。 这 和 地 球 大 相 径 寿 ， 地 球 上 南极 处 于 极 
慎 时 ， 北 极 则 处 于 极 夜 ， 反 之 尔 然 。 


13-5 ” 瓦 充 星 上 的 昼夜 变更 线 和 双 极 昼 现 象 


四 方 概念 的 重新 考察 

从 苏州 地 区 夜间 卫星 地 图 ( 见 图 13-6 ) 中 的 灯光 可 以 看 出 ， 苏 州 的 街道 格局 大 体 
是 沿 着 东 、 西 、 南 、 北 四 个 方向 展开 的 ， 因 为 在 温带 地 区 房 层 南 北 布局 可 以 充分 获得 
阳光 。 
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13-6 ”苏州 上 空 的 卫星 夜 视 照 片 〈 图 片 来 自 NASA) 


地 球 上 对 正 南 、 正 北 的 定义 是 地 轴 的 指 癌 ， 由 于 地 球 沿 相对 稳定 的 地 轴 旋 转 ， 因 
此 有 以 下 几 种 不 同 的 现象 和 相应 的 测量 霄 北 的 方法 。 


口 太阳 在 天 球 上 视 运 动 的 最 局 点 和 最 低 点 在 请 北方 向 上 , 因此 可 以 通过 正午 测量 
立 杆 最 短 影 子 长 度 的 方法 确定 正 南 或 者 正 北 。 
口 夜间 星辰 围 纸 天 极 旋转 做 圆周 运动 , 因此 可 以 通过 寻找 星辰 运动 的 圆心 来 确定 
天 极 ， 并 由 此 导出 南北 方位 。 
口 地 人 磁 现 象 也 与 绕 地 轴 的 旋转 运动 有 关 , 因此 可 以 通过 测定 磁极 的 方 回 粗略 确定 
以 上 现象 和 测量 方法 在 也 克星 上 同样 适用 ,只 是 对 于 第 一 点 会 有 两 次 正午 ， 即 恒 
星 穿 过 于 午 圈 的 时 刻 。 换 句 话 说 ， 瓦 克星 上 南北 的 概念 和 地 球 上 并 无 差异 。 
那么 ， 瓦 克星 上 的 房屋 也 要 坐 阔 贿 北 或 者 坐 北朝 南 吗 ?把 这 个 问题 再 精确 化 一 
上 护 ， 可 以 这 样 提出 : 假设 在 瓦 殉 星 北 半球 中 局 纬 度 地 区 ,长 时 间 平 均 而 言 ， 房 屋 的 问 
阳 面 参加 哪 个 方向 ， 才 可 以 获得 最 大 的 采光 量 ? 
通过 数值 模拟 ,我 们 发 现 瓦 殉 星 和 地 球 是 一 样 的 ， 向 阳 面 朝 问 南方 的 时 候 ， 房 屋 
可 以 获得 最 大 的 及 区 量 。 
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周年 运动 的 问题 

正 东 、 正 西方 位 可 以 从 正 南 、 正 北方 位 推导 出 来 。 但 在 地 球 上 与 此 有 关 的 概念 还 
包括 分 至 四 时 一 -一 春分 、 夏 至 、 秋 分 、 冬 至 。 在 地 球 的 文化 里 ， 这 四 个 时 间 点 往往 
有 重要 的 天 文 与 文化 含义 。 

在 春秋 分 点 ， 全 球 胆 夜 平分 ， 太 阳 从 正 东升 起 、 正 西沙 下 ,太阳 直 射 亦 道 ; 在 收 
至 点 , 北半球 日 恒 时 间 最 长 , 太阳 升 起 和 落下 点 的 位 置 最 偶 北 , 正午 立 杆 的 影子 最 短 ， 
太阳 直射 北 回归 线 ; 冬至 点 则 与 夏至 相反 。 


那么 瓦 到 星 上 会 怎么 样 呢 ? 容易 理解 的 一 点 是 ， 大 多 数 周期 性 将 不 再 催 单 你 持 
了 。 但 要 想 更 加 透彻 地 理解 这 一 问题 ， 我 们 需要 完整 建立 瓦 克 星 的 天 球 系统 。 天 球 系 
统 以 背景 星空 为 基准 ， 然 后 确定 各 个 星体 在 天 球 上 的 运动 方式 。 当 特定 的 儿 何 关系 出 
现时 ， 就 发 生 一 定 的 天 文 事件 。 下 面 我 们 简单 罗列 一 些 容易 观察 到 的 事件 。 


口 母 星 沿 着 黄道 运动 到 黄 赤 交点 , 此 时 母 星 直射 赤道 、 正 东 正 西 起 落 , 昼夜 平分 。 

口 某 个 母 星 对 应 白 碍 时 间 最 长 的 正午 时 间 点 ,此 时 这 个 母 星 直射 某 条 回归 线 , 正 
午 立 杆 的 影子 全 年 最 短 。 

口 两 个 母 星 的 视 夹 角 为 0 的 点 ， 此 时 发 生食 变 。 

口 两 个 母 星 的 视 夹 角 最 大 。 


所 以 这 里 有 一 个 重要 的 理论 问题 要 考虑 , 那 就 是 确定 星体 间 这 些 几 何 关 系 发 生 的 
先后 关系 和 周期 。 
可 能 的 历法 

历法 中 是 一 种 文化 的 计时 方法 , 它 也 有 服务 于 农业 生产 的 目的 , 因此 有 天 文 历 和 
农业 历 的 分 别 ， 前 者 依据 天 文 现象 的 周期 性 来 计时 ,后 者 依据 气候 现象 的 周期 性 来 指 
导 农 业 生产 。 

太阳 的 周年 运动 决定 了 地 球 的 光 热 条 件 ， 进 而 决定 了 气候 现象 的 变化 ， 因 此 ， 对 
于 地 球 的 许多 文化 ， 天 文 历 和 农业 历 是 吻合 的 。 那 么 瓦 克 星 上 会 有 什么 不 同 呢 ? 

基于 我 们 的 数值 模拟 ， 下 面 先 考察 一 些 现象 的 周期 性 。 

口 恒星 的 周 日 视 运 动 保 持 相 对 稳定 的 周期 ， 因 此 天 的 概念 会 得 到 保持 。 

口 相对 于 篆 景 星空 ， 和 行星 公转 相 联 系 的 周期 是 类 周期 的 ， 因 此 年 的 概念 需要 

修正 。 
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口 行星 上 最 显著 的 天 文 事件 是 两 颗 母 星 的 食 变 ,但 该 类 事件 是 类 周期 的 。 

口 行星 接收 到 的 来 目 两 颗 母 星 的 能 量 有 显著 的 年 际 变 化 , 但 存在 一 个 以 几 年 为 跨 
度 的 类 周期 性 。 

因此 ， 我 们 可 以 推测 瓦 殉 星 的 历法 有 如 下 儿 种 类 型 。 

口 星 历 : 以 至 景 星空 为 基准 。 

口 食 历 : 以 两 颗 母 星 的 食 变 为 基准 。 

口 农历 : 以 气候 周期 为 基准 。 


这 三 种 历法 的 基准 都 是 类 周期 的 ， 且 周期 各 不 相同 ， 因 此 维护 瓦 殉 星 的 历法 系统 
需要 随时 保持 对 各 种 星体 的 观测 。 在 三 种 历法 中 , 食 历 和 农历 的 确立 基准 比较 易于 观 
测 ， 因 此 容易 被 原始 一 些 的 文化 建立 ; 而 星 历 的 建立 则 复杂 得 多 ,我们 在 下 一 市 略 加 
详 述 。 


质心 咏 、 子 时 和 星 历 


和 背景 星空 相 联 系 的 是 两 颗 母 星之 间 的 质心 点 ， 两 颗 母 星 围绕 质心 点 做 椭圆 运 
动 。 母 星 在 背景 星空 的 顺 行 、 逆 行 和 拐点 都 同 质心 点 的 位 置 有 关系 。 


质心 点 出 现在 两 个 母 星之 间 , 因此 在 日 天 可 见 ; 它 在 天 球 的 对 径 点 则 是 夜间 可 见 。 
而 夜间 方便 的 观测 条 件 ， 或 许 会 让 对 径 点 起 到 非常 重要 的 作用 。 如 果 存 在 一 种 几何 测 
量 方 法 能 够 顺利 测量 出 质心 点 和 它 的 对 径 点 , 我 们 可 以 用 质心 对 径 点 过 天 球 了 于 午 圈 的 
时 刻 作 为 子 时 一 一 日 周期 运动 的 起 始 时 刻 。 进 一 步 ， 可 以 用 在 子 时 菏 颗 忱 星 初 现 于 地 
平 轿 或 者 过 子午 圈 的 方式 来 确定 周年 运动 的 起 点 。 


或 许 读者 会 对 这 上 段 讨论 很 不 解 , 但 能 够 精确 测定 时 间 和 位 置 是 更 加 发 达 的 文明 确 
立 的 基础 。 人 类 是 在 第 谷 '“ 的 观测 、 开 普 勒 “定律 和 牛顿 万 有 引力 的 发 现 之 后 , 才 
砍 定 了 现代 文明 的 基石 。 由 于 类 周期 的 不 确定 性 ,用 食 历 和 农历 是 无 法 建立 宇宙 间 物 
体 精确 的 几何 关系 的 ; 只 有 使 用 星 历 ， 虽 然 也 是 类 周期 的 ， 但 测定 出 来 的 时 间 和 空间 
关系 可 以 用 来 发 现 整个 军 宙 的 秘密 。 


粗略 计算 宜 居 条 件 


我 们 以 液态 水 的 稳定 存在 作为 行星 的 宜 居 条 件 ， 可 以 做 如 下 最 为 粗略 的 估计 。 假 
设 母 星 为 黑体 .是 表面 温度 分 别 为 Ti 和， 母 星 的 半径 分 别 为 RI 和 R,， 瓦 克星 的 
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行星 反照 率 为 a， 半径 为 RR， 视 瓦 克星 为 黑体 且 表 面 温度 为 及， 可 以 建立 如 下 方程 : 


4TFR2a7” 4nxR:oT’ 
(a) 1 -1 二 Oe 


2 
13 470723 


|* 党 4nR; oT 


对 地 球 而 言 ，a 的 取 值 在 0.3 附近 。 考 虑 到 大 气 层 的 温室 效应 中 ， 我 们 只 要 今 吃 
保持 在 0C 附 近 即 可 。 

虽然 宜 居 条 件 的 估计 涉及 行星 表面 的 物理 机 制 , 但 最 终 化 简 的 公式 里 只 保留 了 一 
些 纯 几 何 量 的 简单 对 比 。 所 以 , 我 们 仍然 把 宜 居 问题 的 粗略 估计 纳入 到 恒星 系 建 模 的 
范围 里 。 


恒星 系 建 模 结果 
我 们 最 终 选 定 如 下 一 组 参数 作为 进一步 模拟 的 基础 。 
母 星 一 


质量 : 1.29 倍 太阳 质量 
光度 2.7 倍 太阳 光度 
母 星 二 

质量 : 1.1 倍 太阳 质量 
光度 1.$ 倍 太阳 光度 
瓦 克 星 

半径 : 8388 公里 
自转 周期 ，23 小 时 


自转 轴 倾 角 : 20° 
表面 重力 加 速度 : 10 米 /平方 秒 


286 ， 科 学 的 极致 : 漫谈 人 工 智能 


行星 的 建 模 


行星 建 模 是 涉及 行星 表面 物理 机 制 的 建 模 过 程 。 我 们 完成 了 地 表 特 征 的 生成 、 温 
室 效 应 的 估计 和 对 大 气 现象 的 初步 模拟 。 
建构 地 表 特 征 


次 形 方块 算法 “是 常用 的 地 表 特 征 生成 算法 , 它 的 常见 形式 是 在 一 个 方形 区 域 上 
展开 的 。 我 们 对 它 稍 加 变形 ， 让 它 适 应 球面 上 地 表 特 征 生成 的 特殊 需求 。 


如 图 13-7 所 示 ， 标 准 的 雄 形 方块 算法 会 反复 执行 如 下 两 大 步骤 。 


13-7 ”菱形 方块 算法 的 中 心 点 生成 


口 方块 步 又 。 取 方块 四 角 点 的 平均 值 作 为 中 心 点 的 基础 值 , 再 在 基础 值 上 三 加 一 
个 反映 粗糙 度 的 随机 值 ， 该 随机 值 与 方块 边 长 和 粗糙 度 正 相关 。 
口 区 形 步 又 。 取 姿 形 四 角 点 的 平均 值 作 为 中 心 点 的 基础 值 , 再 在 基础 值 上 三 加 一 
个 反映 粗糙 度 的 随机 值 ， 该 随机 值 与 攻 形 边 长 和 粗糙 度 正 相关 。 


第 13 章 ， 瓦 克星 计划 : 创造 一 个 三 体 世 界 | 287 


两 个 步 嗓 交错 执行 ， 会 逐渐 把 方形 区 域 密 分 十 满 。 
我 们 在 球面 经 纬 网 格 基础 上 改造 锁 石 方块 算法 ， 主 要 有 以 下 四 个 要 点 。 


口 最 左 经 线 和 最 右 经 线 要 粘 合 在 一 起 ， 其 上 的 对 应 格 点 取 相 同 值 。 

口 最 上 的 纬 线 是 北极 点 ， 要 烙 合 成 一 个 点 ， 该 纬 线 上 的 格 点 取 相 同仁。 
口 最 下 的 纬 线 是 南极 点 ， 要 烙 合 成 一 个 点 ， 该 纬 线 上 的 格 点 取 相 同仁。 
口 不 同 纬 线 上 格 点 的 间 隅 长 度 不 等 ， 与 纬度 的 余弦 成 正比 。 


在 算法 中 基础 值 会 车 加 一 个 随机 的 粗粮 量 , 但 在 实际 模拟 中 我 们 寻求 的 是 一 个 
定 的 地 表 特 征 ， 怎 么 解决 这 个 问题 呢 ? 其 实 ， 只 要 采用 确定 性 的 伪 随 机 数 生成 器 ， 
同时 赋予 生 成 融 相 同 的 种 子 〈seed )， 就 可 以 顺利 解决 问题 。 


图 13-8 瓯 是 我 们 生成 出 来 的 一 幅 瓦 克星 全 球 地 形 图 .可 以 看 到 有 两 个 大 陆 和 两 个 
大 的 品 屿 。 大 陆 上 有 山地 、 高 原 、 平 原 等 地 形 区 别 。 当 把 地 图 按照 相应 的 经 纬度 投影 
( 麦 卡 托 投影 法 It") 到 球面 之 上 ,我们 便 得 到 了 瓦 克星 全 球 的 俯视 图 ( 见 图 13-1 )， 加 
上 恒星 照 册 产生 的 日 角 和 漂 夜 便 得 到 了 图 13-2 中 的 景象 。 


13-8 ” 瓦 克星 全 球 地 形 图 〈 麦 卡 托 投影 法 ) 


温室 效应 的 估计 

本 节 我 们 用 一 个 简化 模型 来 估计 瓦 克 星 的 温室 效应 。 一 方面 , 我 们 不 考虑 地 气 系 
统 的 纬 向 差异 ， 认 为 系统 参量 只 是 纬度 的 函数 。 另 一 方面 ,我 们 假设 瓦 克星 类 似 于 地 
球 ， 有 相同 的 地 气 系统 辐射 平衡 模式 Pu ( 如 图 13-9 所 示 )。 
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13-9 地 球 地 气 系统 能 量 收 支 平衡 示意 图 〈 图 片 来 自 NASA) 


我 们 设 定 7 和 7, 代表 地 表 温 度 和 大 气温 度 , 它们 都 是 纬度 g 和 时 间 的 函数 。 也 
代表 全 球 的 平均 大 气温 度 。 疡 和 疡 分 别 代表 母 星 一 和 和 母 星 二 的 人 射 短波 辆 射 带 来 的 能 
量 。 我 们 考虑 下 执 面 “的 物 态 变化 ( 如 是 否 结 冰 )， 它 会 影响 反照 率 > 和 比热容 c。 


依据 能 量 转 移 过 程 的 不 同 ， 我 们 做 如 下 讨论 。 


口 短波 辐射 的 大 气 吸 收 : a(L+ 工 ) 
口 短波 辐射 的 地 面 吸收 : w, (五 + 姜 ) 
口 地 面 的 长 波 辐射 的 发 出 : 
口 大 气 长 波 辐射 的 发 出 : c7 
口 长 波 辐 射 的 大 气 吸收 : 0007 
口 长 波 辐射 的 地 面 吸收 : xo7* 
口 地 面 和 大 气 之 间 的 热 交 换 ( 热力 泡 和 蒸发 ): p(T -7) 


不 同 征 度 市 之 间 的 温度 差异 会 市 来 大 气 热 交换 ,一 般 而 言 ， 同 一 纬度 市 会 有 能 量 
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流入 和 流出 ， 其 净 差 我 们 可 以 设 为 : K(7, -了 ) 。 
上 述 公 式 中 的 参量 可 以 通过 和 地 球 一 样 的 假定 值 来 获得 。 联 立 前 面 诸 公式 有 


d7 1 


= 一 | o (三 + 五 )+wa7 -or -p(T -7,)| 

C 
d7 ] 4 4 TT 
dt = (Dh +L)+ooT, ea A) 


我 们 可 以 根据 本 式 展开 模拟 。 


初步 模拟 大 气 现象 
将 基本 的 物理 定律 应 用 于 大 气 的 运动 ,我们 可 以 得 到 大 气 运动 基本 方程 


dV 1 
—=g——Vp—20xV+F 
dt 万 


理论 上 ,只 要 对 上 述 基本 运动 方程 差分 化 , 我 们 可 以 直接 应 用 最 简单 的 欧 拉 法 外 
来 解 算 这 个 偏 微分 方程 。 我 们 在 经 纬 网 格 上 展开 了 计算 ， 在 这 个 过 程 中 遇 到 了 一 系列 
出 乎 意料 但 有 意思 的 问题 ， 这 里 我 们 仅 举 一 个 例子 一 极点 问题 。 


在 经 纬 网 格 里 , 极点 被 展 成 了 90” 纬 线圈 ,从 球面 的 一 个 内 点 转 而 变 成 了 特殊 的 
边界 线 。 在 解 算 偏 微 分 方程 时 ,我们 需要 引入 什么 样 的 边界 条 件 才 能 表达 极点 的 特殊 
性 呢 ? 


容易 看 到 ， 对 于 极点 上 的 标量 S$， 标 量 从 一 个 点 值 变 成 了 经 度 A 的 函数 : 


对 于 极点 上 的 一 个 长 度 为 《、 沿 看 经 度 久 指 回 极点 的 问 量 * ， 该 同 量 也 应 该 变 成 
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经 度 A 的 向 量 函 数 x( A), 但 该 困 数 在 经 纬 网 格 里 应 该 取 什么 形式 呢 ? 假设 向 量 雹 属于 
球面 上 的 一 个 连续 回 量 场 系 对 于 极点 附近 的 一 个 充分 小 的 纬度 轿 C， 可 以 认为 回 量 
场 王 在 整个 小 纬度 阁 上 保持 回 量 关 不 变 ， 转 换 到 经 纬 网 格 里 有 : 


2X =£cos(]—h) 
Xi =《SImn(7 一 人) 


可 以 看 到 径 线 和 纬 线 方向 的 分 量 值 都 和 C 的 大 小 无 关 , 因此 可 以 认为 极点 的 情况 
是 C 的 一 种 极限 ， 可 以 采取 和 上 式 相 同 的 形式 。 

我 们 的 这 个 模拟 在 处 理 地 面 和 大 气 的 长 波 辐 射 方面 还 有 一 些 缺 陷 , 导致 长 期 计算 
时 系统 发 散 ， 这 些 缺 陷 会 在 未 来 的 计划 里 改进 。 这 里 只 展示 其 中 一 部 分 模拟 结果 ， 如 
图 13-10 和 图 13-11 所 示 。 


图 13-10 ”模拟 开始 时 刻 0 度 经 圈 气 温 沿 着 高 度 的 分 布 状况 〈 男 见 彩 插 ) 


13-11 ”模拟 一 段 时 间 之 后 0 度 经 圈 气 温 沿 着 高 度 的 分 布 状况 〈 另 见 彩 插 ) 


以 上 两 幅 图 展示 了 模拟 开始 和 进行 一 段 时 间 之 后 气温 沿 着 高 度 的 分 布 状况 。 气 温 
高 的 颜色 是 红色 ， 和 气温 低 的 颜色 是 蓝 色 。 对 比 两 图 可 以 发 现 ， 模 拟 开始 时 ， 地 面 长 波 
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锅 射 被 近 地 大 气 层 吸收 ， 所 以 近 地 的 气温 高 ， 而 高 空 是 冷 的 然而 系统 演化 一 段 时 间 
之 后 ， 大 气温 度 随 着 高 度 上 升 ， 首 先是 出 现 逆 变 ， 高 空中 出 现 冷气 层 ， 渡 过 冷气 层 继 
续 上 升 后 ,温度 才 开始 上 升 . 这 恰巧 和 地 球 上 的 实际 情况 吻合 ,冷气 层 以 下 是 对 流 层 P3 
冷气 层 以 上 是 平流 层 Pa。 


未 来 的 计划 


经 纬 网 格 并 不 适 于 计算 全 球 的 大 气 运动 , 更 好 的 做 法 是 基于 球面 详 模 式 来 计算 大 
气 状态 。 某 种 状态 下 的 大 气 将 按照 一 定 概率 发 生 东 种 气象 事件 ， 当 我 们 给 定 了 这 种 对 
应 关系 ,就 可 以 由 此 模拟 瓦 殉 星 全 球 的 天 气 『。 同 时 有 了 全 球 的 风 场 ， 也 可 以 计算 洋 
流 以 及 洋流 对 大 气 的 反作用 了 。 

降水 带 来 了 地 面 径流 ， 于 是 有 了 地 表 的 河流 、 湖 泊 ， 进 而 还 包括 了 流水 带 来 的 侵 
人 刨 、 风 化 现象 。 这 些 现象 的 模拟 需要 极 大 的 存储 量 和 计算 量 。 


生物 图 建 模 


生物 圈 建 模 是 我 们 目前 还 没有 展开 的 工作 ， 本 市 主要 介绍 我 们 初步 的 考虑 。 生 物 
圈 建 模 的 目标 是 创建 一 个 目 我 演化 的 瓦 克 星 生物 世界 。 这 里 的 生物 有 一 定 的 形态 ,能 
够 日 我 维持 和 繁衍 ， 同 时 处 于 一 个 生态 网 链 结 构 之 中 。 和 后 物 圈 建 模 提供 一 个 瓦 殉 星 和 后 
物 的 基础 ， 用 户 可 以 设计 出 新 的 生物 物种 ,并 且 操 纵 生 物 个 体 的 行为 。 这 样 瓦 克 星 世 
界 就 可 以 变 成 一 个 高 级 的 生态 学 电子 游戏 。 


物种 编码 与 环境 参数 


与 地 球 生物 利用 遗传 物质 编码 了 生命 的 各 种 信息 一 样 , 瓦 殉 星 上 的 生物 也 有 日 己 
的 编码 方式 。 具有 相同 编码 类 型 的 生物 个 体 的 集合 构成 一 个 物种 , 它们 有 相同 的 原型 ， 
但 有 略微 不 同 的 各 种 具体 参数 。 

在 初步 描述 瓦 克星 生物 编码 之 前 , 我 们 先 回 顾 地 球 生 物 的 异 速生 长 现象 “。 异 速 
生长 律 是 实际 测量 到 的 一 类 需 律 关系 ， 它 把 生物 体 的 矿 度 同 其 生理 、 生 态 特 征 联系 起 
来 。 而 这 个 观测 到 的 竹 律 , 往往 不 同 于 将 生命 体 几 何 结构 同 构 扩 张 后 得 到 的 理论 才 律 ， 
因此 称 为 异 速生 长 。 有 具体 可 以 参见 本 书 第 9 半 中 的 相关 讨论 。 

文献 中 经 第 提 到 的 异 速生 长 现象 包括 : 
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D 体重 和 摄食 率 正 相关 ， 需 律 为 0.7; 
口 体重 和 基础 代谢 率 水 平 正 相关 ， 和 才 律 为 0.75， 称 为 殉 茉 伯 定 律 辣 ; 
口 体重 与 内 豪 增 长 率 负 相关 ， 客 律 大 约 在 -0.27 左右 。 


我 们 其 实 可 以 把 异 速生 长 律 理解 为 一 种 高 效 的 编码 方式 , 仪 仪 信 度 一 个 参数 就 决 
定 了 生理 学 和 生态 等 的 很 多 特征 。 所 以 ,作为 一 个 初步 的 提议 ,我 们 可 以 考虑 瓦 殉 星 
的 物种 编码 了 以 下 信息 。 


口 形态 学 信息 : 对 植物 来 说 ， 可 以 包括 工 系统 的 生长 规则 ; 对 动物 来 说 ， 可 以 包 
括 特 征 尺 度 、 骨 染 结 构 、 体 重 等 ; 

口 行为 学 的 信息 : 如 最 大 奔跑 速度 ; 

口 生态 学 信息 : 内 课 增 长 座 、 食 谱 组 成 等 。 


刻画 一 个 物种 的 生存 状态 ， 我 们 需要 有 物种 丰 度 的 地 理 分 布 和 物种 种 群 的 年 龄 
结构 。 


L -系统 与 植物 形态 

L- 系 统 是 一 种 重 写 系统 中 。 如 果 配 合适 当 的 图 形 解释 ，L- 系 统 可 以 用 来 刻画 杆 
物 的 形态 。 下 面 我 们 以 一 个 例子 来 说 明 。 

重 写 规则 : 


X 一 下 -[[X]+X]+EFI+FX]-X 
F 一 FF 


初始 符号 : X 
图 形 解 释 : 


平河 光 转 258 
一 再: 态 转 25° 


这 个 L- 系 统 生成 的 图 形 如 图 13-12 所 示 。 
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13-12 |L- 系 统 示例 (图 片 来 自 维基 百科 ) 


游戏 与 生态 模拟 

首先 让 我 们 从 著名 的 描述 猎物 和 捕食 者 种 群 关系 的 Lotka-Volterra 方程 "开始 讨 
论 。 我 们 有 x、y 分 别 代 表 猎 物 和 捕食 者 的 数量 , 而 w、B 、y、6 是 和 两 个 物种 党 
衍 与 捕食 有 关 的 参量 。 


=x(a-py) 
Dy _ 
df W329 


假设 所 克星 的 生物 圈 里 有 很 多 生物 之 后 ， 针 对 其 中 一 对 猎物 和 捕食 者 种 群 ， 应 该 
怎么 确定 Lotka-Volterra 方程 中 的 参量 呢 ? 

我 们 已 经 知道 ， 和 繁衍 过 程 有 关 的 内 裹 增长 率 可 以 从 异 速 生长 率 导 出 , 但 和 捕食 
有 关 的 参量 取决 于 多 种 因素 ， 如 最 快 奔 跑 速 度 、 转 弯 速 度 、 捕 食 策 略 等 。 我 们 应 该 如 
何 给 这 些 参 量 赋值 呢 ? 
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一 个 解决 方法 是 通过 游戏 。 在 游戏 里 的 捕食 过 程 ， 用 户 操 作 捕 食 者 抓 捕 独 物 ， 尺 
量 发 挥 捕 食 者 的 各 种 优势 。 通 过 对 游戏 场景 的 统计 , 我 们 可 以 计算 出 上 述 方程 的 参量 ， 
进而 指导 生态 系统 的 演化 。 


宇宙 里 的 自省 意识 


根据 截止 到 2014 年 6 月 的 统计 数据 ，2009 年 3 月份 升 空 的 开 普 勒 卫星 已 经 帮助 
人 们 确认 发 现 了 近 千 颗 系 外 行星 ,这些 发 现 让 人 们 确认 了 行星 在 宇宙 中 的 普遍 性 。 我 
们 有 理由 进一步 相信 ， 宇 宙 如 此 广 弯 ,地 球 上 智慧 生命 的 存在 应 该 不 是 一 件 扳 立 而 特 
别 的 事情 。 


然而 , 对 于 生命 在 宇宙 中 普遍 存在 一 事 , 我 们 的 文化 似乎 还 没有 做 好 充分 的 准备 。 
从 某 种 程度 上 讲 ， 瓦 克星 计划 试图 通过 差异 与 不 同 , 使 我 们 人 类 保持 一 种 在 宇宙 里 有 自 
我 反省 的 意识 。 


版 权 声明 


文中 关于 毕 达 册 拉 斯 三 体 问题 的 图 片 来 目 于 Greg Laughlin 教授 ， 他 已 经 全 权 授 
权 我 们 使 用 ， 特 此 鸣谢 。 
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第 14 合 ” AI 天气 预报 员 


“ 云 就 像 是 天 气 的 “招牌 ”， 
天 上 挂 着 什么 云 ， 
就 将 出 现 什么 样 的 天 气 。 
《看 云 识 天 气 》 


风 从 哪里 来 


想必 很 多 人 小 时 候 履 有 凝视 天 边 多 彩云 打 的 经 历 吧 , 我 们 在 小 学 读本 里 学 习 过 如 
何 通 过 观察 天 空中 云 的 变化 来 预测 天 气 。 观 察 变 化 多 端的 云 朱 不 仪 仅 是 一 个 科学 活 
动 ， 也 是 一 件 贰 心 悦 目 的 事情 。 


通过 观察 ,我 们 的 先 磊 很 早 就 发 现 了 一 些 预 测 天 气 的 方法 , 许多 古老 的 谚语 世代 
传扬 ， 诸 饥 完 “全 东 风 ” 的 天 气 预 报 事迹 也 被 一 谈 再 谈 。 但 是 我 们 是 从 什么 时 候 才 开 
始 科学 地 认识 天 气 预报 的 呢 ? 要 知道 ， 只 有 特定 人 可 以 玩 的 技能 叫 魔法 ， 所 有 人 都 可 
以 稳定 复 现 的 玩法 才 叫 科学 。 

1854 年 ,英法 联军 的 舰队 准备 进行 一 次 远征 ， 好 不容 易 到 达 了 目的 地 , 却 遭 遇 了 
一 场 突如其来 的 风 雄 ,舰队 几乎 全 军 徐 没 。 大 家 当然 很 不 甘心 ， 有 设 有 可 能 在 风 答 来 
临 前 就 预知 这 场 风 和 村， 从 而 避免 损失 呢 ? 
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于 是 , 时 任 巴 黎 天 文 台 台 长 的 勒 佛 里 埃 ( 此 君 因 发 现 了 海王 星 而 享有 尝 高 的 声誉 ) 
受命 调查 此 次 风暴 的 来 龙 去 脉 。 

他 发 信 给 各 国 天 文学 家 和 和 气象 学 家 ， 索 要 1854 年 11 月 12 日 至 16 日 这 5 天 的 气 
象 报 告 ， 共 收 到 250 封 回 信 。 他 把 这 些 天 气 数据 填 在 地 图 上 ( 即 后 来 的 天 气 图 ， 见 图 
14-1 ), 发 现 这 个 风暴 是 从 西向 东南 方向 规律 移动 的 , 前 一 二 天 已 经 在 法 国 和 西班牙 造 
成 了 灾害 。 因 此 1855 年 3 月 19 日， 他 在 法 国 科学 院 作 报告 ， 建 议 组 织 气象 站 网 ， 用 
电报 迅速 把 它们 集中 在 一 起 ,分 析 图 上 的 风暴 走向 ， 便 可 以 预报 风暴 的 未 来 路 径 。 


他 的 提议 很 快 得 到 了 响应 。1856 年 ， 法 国 24 个 电报 连接 的 气象 站 建成 。 


全 
本 1 上 
He 


bey. 0 Tip 
A Nd | 
天 SS cr > 


14-1 天 气 图 
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有 了 天 气 图 ， 如 何 得 知 明天 的 天 气 呢 ? 答案 是 : 靠 经 验 。 谷 兰 气象 学 家 日 贝 罗 总 
结 所 ;: “发现 的 规则 是 ， 在 我 们 国家 内 的 大 气压 差 都 与 风 强 有 关 ， 而 且 风 通 第 与 等 压 
线 斜 交 , 因此 , 如 果 气 压 由 北 往 责 降 , 则 吹 东 风 ; 如 果 气 压 差 由 南 往 北 降 , 则 吹 西风 。 


显然 , 当时 的 天 气 预 报 还 是 以 人 的 判断 和 经 验 为 主要 技术 ,但 是 随 厦 科技 的 发 展 ， 
首先 发 生 的 变化 是 人 们 收集 气象 数据 越 来 越 方便 。 人 们 在 世界 各 地 建设 了 很 多 气象 
站 ， 甚 至 一 个 家 硅 也 可 以 拥有 目 己 的 目 动 气象 站 〈 见 图 14-2 )。 气 象 站 可 以 小 到 放 在 
口袋 里 面 , 由 很 小 的 Microduino 像 拱 积木 一 样 做 出 来 , 这 样 的 微型 气象 站 ( 见 图 14-3 ) 
可 以 自动 探测 温 湿 度 、 光 照 和 气压 等 基本 数值 。 


14-2 ”自动 气象 站 14-3 ”微型 气象 站 


气象 站 之 间 也 早已 不 再 由 电报 连接 , 现在 很 多 个 人 气象 站 可 以 把 数据 实时 同步 到 
互联 网 上 , 比如 Yeelink 在 北京 就 公开 了 数 十 个 互联 网 日 动 探 测 点 的 数据 ( 见 图 14-4 )， 
里 然 看 起 来 还 不 够 密集 , 但 你 要 是 知道 气象 局 在 天 气 网 上 全 北京 只 公开 了 一 个 南郊 观 
象 人 台 的 数据 ， 就 会 这 刻 地 感受 到 开放 的 气象 才 是 未 来 的 趋势 。 


除了 地 面 气 象 站 ， 人们 也 进行 了 很 多 其 他 的 尝试 。1927 年 , 美国 陆 盏 气象 学 家 入 
尼斯 … 布莱尔 (Dennis Blair ) 成 功 进行 了 无 线 电 探 空 实 验 〈 探 空 气球 ); 1960 年 ， 美 
国家 航空 航天 局 发 射 了 第 一 颗 成 功 的 气象 卫星 TIROS1 号 ; 1988 年 美国 正式 进行 下 
一 代 天 气 雷 达 网 的 建设 ( 主角 出 来 冒 了 个 泡 )。 
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图 14-4 Yeelink 云 平台 自动 探测 点 的 数据 


随 着 探测 技术 的 发 展 ,数据 处 理 的 技术 也 得 到 了 极 大 的 提高 。 根 据 理想 气体 状态 
方程 、 热 力学 定律 、 洲 涡 理 论 等 模型 建立 的 天 气 预报 模型 逐渐 成 为 主流 。 其 间 ， 最 具 
里 程 碑 意 义 的 事件 当 属 冯 ， a 批 电 子 计算 机 ENIAC 于 1949 年 
在 宾夕法尼亚 大 学 开始 运行 ， 而 这 台 巨 无 条 机 带 ( 见 图 14-5 ) 当仁不让 地 开启 了 天 气 
预报 的 数值 计算 新 时 代 。 
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14-5 ENIAC 


马 : 请 依 曙 的 小 组 为 了 简单 化 ， 只 计算 了 气压 的 变化 ， 预 测 了 24 小 时 之 后 的 气 
压 曲 线 ( 见 图 14-6 )。 但 是 由 于 当时 的 计算 速度 有 限 ， 计 算出 结果 的 时 候 ， se 
过 去 了 ， 数 值 没有 在 实际 中 发 挥 作用 。 但 这 相 比 19 世纪 的 那些 “经 验 ”， 已 经 前 进 了 
很 大 一 步 。 


300 ， 科 学 的 极致 : 漫谈 人 工 智能 


RE 
NE 
> : MA A > 9 
J ~ T 2 了 人 \ 


[VEN 


Trp 
7 


rz 之 是 yo DB 一 
于 OB 区 了 
2 
> 一 Ld f° 
ry fr 2 
ED f Fr Did 
出 ZY 
向 pe 


7 
™ 
- 1 
7 .1 
4 r = n 
wT U 
Ne 
WY 上 
NS * 本 5 
雪 A Vy 四 
和 AS 
了 3 
7 /7 AAA 
-ze 1 
’ ne f 


Fig, 2. Foreccast of January 5$, 1949, 0300 GMT: (a) observed = and HN at 上 一 Di (b) observed z and » 
at 1 = 24: hours; (cj obscrved (continuous lines) and compured (broken lines) 24-hour height change; (d) 
computed z and 7 at { = 24 hours The height unit is 100 ft and the unit of vorticity is 1/3 x TI90-+ 5cc 


14-6 ”预测 24 小 时 后 的 气压 曲线 


随 看 计算 机 的 发 展 ， 计 算 技 术 也 在 提高 。 现 在 全 志 界 的 气象 学 家 之 间 相 互 协 作 ， 
已 经 可 以 实时 获得 全 球 的 气压 、 风 癌 场 24 小 时 后 的 气压 曲线 并 进行 预测 和 图 形 化 了 。 
其 中 美国 大 气 与 海洋 管理 局 的 Global Forecast System ( GFS ) 已 经 可 以 以 0.5 度 ( 约 合 
20 平 方 公里 ) 的 精度 ， 给 出 全 球 任意 位 置 未 来 7 天 逐 三 小 时 的 温度 、 降 雨 、 风 力 (图 
14-7 是 根据 GFS 生成 的 全 球 风 向 场 , 网 址 是 http://earth.nullschool.net )、 气压 情况 , 也 
可 以 去 晴天 钟 (7timer.com ) 查看 ， 并 可 以 调用 它 提供 的 完善 的 API 进 行 二 次 开发 。 
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14-7 ”全 球 风 向 场 
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怎么 样 ， 看 春 很 不 错 吧 ! 可 是 ， 为 什么 我 们 还 是 感 党 天 气 预报 不 太 准 呢 ? 我 们 都 
听 次 过 “南美 一 只 蝴蝶 电 动 的 翅膀 几 天 后 引起 了 北京 的 一 场 风 暴 ” 的 “ 蝴 恕 效应 ” 吧 ， 
而 天 气 系统 正 是 这 样 一 个 不 可 预测 的 混沌 系统 。 已 经 证 明 ， 精确 长 期 的 天 气 预 报 从 数 
学 上 来 讲 是 不 可 能 的 ,所 以 GFS 以 及 其 他 数值 天 气 预报 模型 的 逐 小 时 和 和 逐 天 预报 的 准 
确 度 也 会 随 着 时 间 的 推移 而 急剧 下 降 。 


那 我 们 精准 天 气 预报 的 梦想 呢 ? 如 末 我 们 把 预测 的 时 间 缩 短 到 未 来 一 到 两 个 小 
时 ， 有 没有 可 能 得 到 高 精度 甚至 是 每 分 钟 的 天 气 预报 呢 ? 这 是 有 可 能 的 。 下 面 轮 到 主 
角 出 场 了 。 


天 气 雷 达 : 杀 目 预报 几 点 几 分 下 雨 


“相信 电脑 前 的 各 位 ， 百 分 之 九 十 五 以 上 都 曾 党 过 “ 落 汤 鸡 ”的 味道 。 
在 贡 怪 可 怜 的 气象 台 的 同时 ， 你 有 没有 想象 过 “自力 更 生 ” 一 下 呢 ? 我 担保 
这 一 点 也 不 难 1” 

一 一 小 龙 哈 亏 


a 大 帽 山 ) 的 球 型 站 置 ( 见 图 14-8 )。 
深 圳 市 气象 局 的 雷达 就 安 疲 在 竹子 林山 项 的 气象 局 楼 项 ( 见 图 14-9 )。 
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图 14-9 ”深圳 气象 局 的 雷达 装 轩 


圆 项 里 面 是 什么 呢 ? 是 一 个 无 线 电 发 射 和 接收 效 置 ( 见 图 14-10 ), 用 来 向 大 气 发 
射 电磁 波 ， 根 据 返 回 的 雷达 回流 来 判断 降雨 的 情况 。 


14-10 无线电 发 射 和 接收 装置 


气象 雷达 工作 的 时 候 会 360。 扫描 , 并 且 会 变换 扫描 的 仰角 , 探测 范围 是 一 个 2.5 
维 的 区 域 ( 见 图 14-11 )， 半 径 大 约 是 230 公里 ， 精 度 是 1 平方 公里 。 新 一 代 天 气 雷 达 
不 仪 可 以 读 出 降雨 强度 ， 而 且 可 以 根据 多 普 勒 效应 直接 读 出 降雨 带 移 动 的 径 问 速度 
( 见 图 14-12 )。 
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图 14-11 气象 雷达 探测 范围 
证 度 图 ‘北京 时 ) 


分 辩 率 : 1.00 km 
日 期 : 2014 年 07 月 06 日 
时 间 : 06:42:00 


14-12 ”新 一 代 气 象 雷达 数据 


但 公布 给 公众 的 扫描 结果 通 铝 是 一 个 平面 图 是 第 一 层 仰角 扫描 的 结果 (〈 见 图 
14-13 )， 中 国 天 OO 
但 仍然 显得 很 专业 ， 很 难 理解 。 不 过 没关系 ， 我 们 一 会 儿 再 来 釜底抽薪 地 解决 读 图 
困难 的 问题 。 
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14-13 ”仰角 扫描 的 结 


地 面 上 的 雷达 站 相互 拼接 起 来 ， 就 可 以 形成 一 幅 伟 大 的 全 景 拼图 (图 14-14 是 
NOAA 的 雷达 网 高 分 辨 率 全 景 动态 拼图 " ),。 雷达 拼图 大 约 每 十 分 钟 更 新 一 次 ,提供 了 
分 钟 级 别 每 平方 公里 的 详细 降雨 情况 ， 是 我 们 进行 高 精度 预报 的 基础 。 


1 
征 


图 14-14 NOAA 雷达 全 景 动态 拼图 


但 是 ， 目 己 家 的 位 置 在 这 种 地 图 上 怎么 看 得 到 呢 ? 答案 是 ， 目 己 动 手 换 地 图 吧 。 


GD 全 美 雷 达 拼 图 网 址 : http://radar.weather.gov/ridge/Conus/full loop.php。 
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如 图 14-15 所 示 ， 从 公开 的 雷达 图 解析 出 矩阵 ， 再 拼接 到 正常 的 互联 网 地 图 上 ， 
就 实现 了 把 家 的 位 置 放 到 和 震 达 图 上 。 
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14-15 ”自己 动手 换 地 图 过 程 


这 样 我 们 可 以 很 下 观 地 看 到 菏 个 地 点 在 某 一 时 刻下 多 大 的 雨 ( 如 图 14-16 所 示 )， 
然后 我 们 假定 这 些 雨 带 移 动 速率 、 强 度 在 短 时 间 内 保持 一 定 ( 这 个 假定 大 多 数 情 况 下 
基本 成 立 )， 这 样 我 们 就 可 以 很 方便 地 看 出 未 来 儿 十 分 钟 之 内 ， 茶 个 地 点 是 否 可 能 受 
到 雨 审 的 威胁 了 。 

很 多 人 疑惑 集 笃 俱乐部 作为 一 个 NGO， 如 何 得 到 和 和 苗 方 相 媲美 的 高 精度 雷达 图 ， 
其 实 我 们 就 是 去 把 多 年 来 大 家 邦 很 想 做 的 雷达 网 和 GIS 的 融合 给 做 了 , 让 大 家 可 以 很 
轻松 地 看 疏 雷 达 图 。 但 是 获得 数据 仅仅 是 万 里 长 征 的 第 一 步 ， 因 为 我 们 还 想 让 电脑 读 
从 雷达 图 ， 让 分 钟 预报 做 到 目 动 化 ， 所 以 杂 波 过 滤 、 风 癌 场 计算 和 预测 降雨 融 的 移动 
等 诸多 难题 还 等 肴 我 们 解决 。 
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14-16 ”未 来 一 小 时 内 的 天 气 
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全 计算 机 一 个 看 收 雷 达 图 的 大 脑 


“一 千 多 个 CPU 进入 了 满 负 荷 ， 
内 存 里 广阔 的 电子 世界 中 ， 
逻辑 的 台风 在 呼 哺 ， 
数据 大 洋 上 流浪 淘 天 ......” 
一 一 刘 息 次 ,《 混 沌 蝴蝶 》 
要 实现 雷达 回 波 预 测 降雨 ， 首先 要 面 对 雷 达 图 的 一 个 致命 问题 ; 你 看 到 的 雷达 


Ee a ee tp 
能 造成 非 降水 回 波 (如 图 14-17 所 示 )。 
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图 14-17” 非 降 水 回 波 〈 另 见 彩 插 ) 


1868 Zz 
31 JUL 96 


经 过 观察 ， 容 易 想到 过 滤 掉 回 波 强度 低 的 那些 数据 ( 即 去 掉 蓝 色 和 白色 )。 美 国 
的 @egb13 同学 做 了 一 个 简单 的 过 滤 ， 效 果 如 图 14-18 所 示 。 


20090906-2059 20090906-2059 


14-18 过滤 回 波 强度 低 的 数据 〈 另 见 采 5 播 ) 
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但 是 ， 这 样 粗 暴 的 方法 会 过 滤 掉 一 些 本 来 是 降水 的 杂 波 。 于 是 ，DarkSky 你 出 了 
第 二 个 杀 需 一 一 图 像 分 割 ， 如 图 14-19 所 示 。 


原始 图 厂 块 切 制 清理 过 的 图 片 


图 14-19 图像 分 割 〈 另 见 彩 插 ) 


把 图 像 分 割 成 为 多 个 不 同 的 部 分 ， 分 别人 工 标记 上 是 否 为 噪音 ， 构 造 分 类 训练 
数据 集 ， 训 练 出 一 个 神经 网 络 模型 ， 可 以 成 功 地 对 唤 音 进行 处 理 ， 如 图 14-20 所 示 。 


没有 噪音 (yey!) 


14-20 ” 降 品 处理 〈 另 见 彩 择 ) 


我 们 发 现 ， 如 果 引 入 更 多 的 特征 ， 包 括 图 像 的 周围 像 系 的 强度 ， 是否 是 日 天 和 半 
夜 等 因素 ， 而 不 仅仅 是 图 像 分 割 ， 就 可 以 得 到 更 好 的 效 末 ， 甚 至 可 以 通过 图 像 处 理 的 
方法 对 噪 首 和 数据 混杂 在 一 起 的 情况 进行 处 理 ， 如 图 14-21 所 示 。 


有 了 一 个 比较 准确 的 雷达 图 作为 基础 ， 我 们 终于 可 以 面 对 大 Boss 了 ， 下 一 个 时 
刻 的 降雨 带 会 移动 到 哪里 去 呢 ? 


14-21 图像 处 理 


这 个 问题 问 的 其 实 是 在 一 段 连续 的 视频 中 ， 如果 知道 了 前 面 儿 帧 的 内 容 ， 如 何 预 
测 后 面 几 帧 的 内 容 ( 如 图 14-22 所 示 ) 这 可 能 是 新 大 脑 皮 层 的 一 个 基础 功能 ( 稚 金 斯 ， 
《人 工 智能 的 未 来 少 ， 可 令 人 略 感 意 外 的 是 ， 这 个 问题 似乎 不 是 学 术 界 的 热点 。 
是 要 搞定 它 。 


Anyway， 我 们 还 
给 定 视 频 的 前 mm 模 ， 预 测 后 a 帆 
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tmt+l? A 1? 712? 3 ttn 


14-22 ”根据 前 几 帧 内 容 预 测 后 几 帧 


1998 年 ， 严 恩 ' 乐 库 的 研究 团队 采用 了 多 层 卷 积 神经 网 络 ( 见 图 14-23 ) 在 手写 
数字 识别 训练 集 MNIST 上 实现 了 超过 99.5% 的 正确 率 。2006 年 ， 辛 顿 的 团队 利用 受 
限 玻 尔 效 曼 机 在 无 监督 训练 集 上 上 自动 归 类 出 人 脸 和 眼 蜡 口 等 人 脸 组 成 部 分 。 到 2013 
年 ， 以 多 层 神经 网 络 为 基础 的 深度 学 习 在 多 个 领域 获得 了 飞跃 式 的 进展 ,甚至 在 物体 
识别 数据 集 Cifar-10 上 也 获得 了 了 90% 左右 的 识别 准确 率 。 


第 14 章 A| 天 气 预报 员 | 309 


(x, y, channel) -> (time, x, y, channe!l) 


Inpur layer {51) 4 feature maps 


convolution layer sub-sampling layer convolution layer sub-sampling layer | fully connected MLP 


14-23 ”多 层 卷 积 神经 网 络 


那么 , 这 么 高 大 上 的 理论 怎么 和 实际 结合 呢 ? 我 们 把 目 编 码 融 的 重建 图 像 改 成 了 
预 佑 下 一 帧 (如 图 14-24 所 示 )， 在 原来 的 程序 上 增加 了 时 间 维 度 。 
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由 于 一 段 时 间 的 降雨 量 是 一 个 曲线 ， 所 以 我 们 把 分 类 的 目标 函数 从 0-1 二 值 改 成 
了 回归 计算 MSE。 受 限于 内 存 ， 我 们 殉 黑 地 把 200 公 里 半径 的 数据 缩减 到 20 公里 ， 
再 用 两 次 卷 积 扩展 到 全 图 。 


我 们 用 了 北京 2013 年 8 月 的 降雨 情况 做 训练 集 (我 们 公开 了 这 个 训练 集 ， 可 以 
在 集 智 百科 上 下 载 )，20 万 的 样本 ， 在 GTX780 上 训练 了 8 个 小 时 。MSE 指标 相 比 传 
统 方法 大 幅 提 高 。 换 言 之 ， 预 报 准 确 度 提高 了 大 约 30%。 

经 过 这 一 年 的 探索 ,我 们 已 经 取得 了 很 多 进展 , 但 这 还 不 够 。 因 为 我 们 的 目标 是 
一 小 时 内 降雨 预报 准确 率 超过 90%, 全 面 超越 传统 方法 ,利用 人 工 智 能 彻底 实现 精确 
的 短 时 降雨 预报 ， 甚 至 超过 人 类 值班 预报 员 的 预报 准确 度 。 


14-24 ” 预 估 下 一 帧 


310 ， 科 学 的 极致 : 漫谈 人 工 智能 
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集 智 俱乐部 的 第 
Bp3 es 一 周 后 受到 苹果 新 品 推荐 , 连续 两 周 位 
列 第 一 ( 见 图 14-25 ) 。 彩 云天 气 的 开放 数据 接口 API 支持 了 数 十 个 应 用 ， 
彩云 天 气 上 线 以 来 通过 API 发 出 预报 超过 两 千 万 次 。 上 线 4 个 月 来 我 们 收 到 
了 来 自 全 国 各 地 包括 微 博 、 电 子 邮件 、 网 站 留言 等 超过 2500 条 的 反馈 ， 用 
户 的 批评 和 鼓励 都 是 我 们 前 进 的 动力 。 
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图 14-25 彩云 天 气 〈 另 见 彩 插 ) 


2013 年 ， 当 我 从 阿里 巴巴 匀 职 的 时 候 , 仅仅 是 想 要 尝试 一 下 米奇 . 奥 特 
曼 ( Mitch Altman ) 所 说 的 “给 自己 买 一 年 时 间 ， 完 全 做 想 做 的 事 ， 看 看 能 
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否 养活 自己 ”。 未 来 是 一 条 充满 未 知 的 道路 ， 在 集 智 读 书 会 和 肖 达 等 同伴 讨 
论 做 天 气 模型 的 时 候 ， 并 不 知道 最 终 能 否 成 功 。 当 我 和 他 人 交流 我 的 想法 的 
时 候 ， 更 多 的 人 会 说 分 钟 预报 这 怎么 可 能 ， 也 有 人 说 就 算 做 出 精准 的 短 时 天 
气 预 报 也 不 会 有 人 用 。 说 实话 ， 支 持 我 的 人 并 不 多 ,压力 很 大 ， 完 全 是 在 咬 
牙 坚 持 。 

但 怎么 能 放 育 呢 ? 你 不 去 做 , 就 没有 清晰 明了 的 雷达 回 波 图 ; 你 不 去 做 ， 
中 国 大 陆 就 没有 分 钟 级 针对 个 人 的 天 气 预报 ; 你 不 去 做 ， 就 有 人 会 在 木林 公 
园 散步 时 被 “ 突 降 暴 十 ”袭击 ; 你 不 去 做 ， 就 不 会 推动 气象 局 雷电 预警 精确 
到 分 钟 的 改革 。 天 气 预 报 不 准 说 了 那么 多 年 ， 你 不 去 做 ,怎么 用 人 工 智 能 改 
善人 类 生活 ? 

“未 来 一 小 时 不 会 有 雨 ， 放 心 出 门 吧 1 我 是 AI 天 气 预报 员 。 

关于 AI 天 气 预报 员 ， 集 智 俱 乐 部 曾 举 办 了 线 下 活动 ， 观 看 活动 视频 ， 
请 扫 左 下 万 二 维 码 。 下 载 彩云 天 气 应 用 ， 请 扫 右 下 万 二 维 砚 。 
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